Gene Anae109_1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1669
Symbol
ID	5376842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1876247
End bp	1877869
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	74%
IMG OID	640843178
Product	hemerythrin HHE cation binding domain-containing protein
Protein accession	YP_001378857
Protein GI	153004532
COG category	[S] Function unknown
COG ID	[COG2461] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.80491
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGCTGG CCAGGACCTT GCTCTCAGGT CGCCGCATGA GCGAGCTCAT CGAGACCGGC 
GCACCGCCCC GGAAGGACCT TCTCAAGCAC CTCATCCTCC AGCTCCATGG CGGCGTCGCC 
CCCGACGCGG TCCAGCGGCA GCTCGTTCGC CTGCTGGGGC AGGTTCCGTA CGGGCTCGTG 
GTGGAGGTGG AGCAGGAGCT TCTGGCGGAC GGCATGCCCG CGGCGGAGGT GACGCGACTC 
TGCCACCTCC ACTCGGCGGC GCTGCAGGGC GCGATCGACC TCTCGGGAGT GCGCACGCCG 
CCCGCGGGTC ACCCGGCCCG CGTCTTCTCC GAGGAGAACG CCGCGCTCGC CAAGCAGGTC 
CAGGCGCTCG AGCACGCCGC CGACGCGCTC GATGCGGTCG TGTCGGAGGG CGGCGCGGGC 
GTGCACCTCC TGCAGGCGCG CGTTCGCGTC AACGCGCTCA CCGACGTCGA GAAGCACTAC 
CTCCGCAAGG AGCACCTGCT CTTCCCGTTC CTCGAGCGGC ACGGCATCAC CGGCCCGCCG 
CAGGTGATGT GGGGCAAGCA CGACCAGACT CGCGCGCTGC TGCGCGCGGC GCACGCGGCG 
CTCGCGTCCG CCGCCGGCGA TCCCGCCGCG GCGCGAGCGC TCTCGGACGG CGCGCTGCGG 
CCGCTGGCGA GCGCGATCCG CGACATGGTG GACAAGGAGG AGAACATCCT CTTGCCCATG 
GCGCTCGACG TGCTCGACGA GCGCGAGTGG TGGGAGATCG CGCGGCAGAG CGACGAGATC 
GGCTACTGCC TCGTCGAGCC CGAGGCGAGC TGGCGCCCCG ACTCCGTGGA CGCGACCGAG 
GCCGCCGCGC CGGCCGCGCG CGTGAAGCTC CCCACCGGCA GCCTCGCGCC CGCGGAGCTC 
GAGGCCATCC TCGGCGCCCT GCCGCTCGAC GCCACGTTCG TGGACGCCGA GGACCGCGTC 
CGCTGGTTCA GCCACGGCAA GGAGCGCGTG TTCTCGCGCA GCCGCGCCGT GATCGGCCGC 
AAGGTGCAGT TCTGCCACCC GCCGTCTTCC GTCGGCACGG TCGAGACGAT CCTCGCGGGC 
TTCCGGGCGG GGACCCAGGA CCGCGCGTCG TTCTGGATCC AGCTGCGCGG GCGCTTCGTC 
CACATCGAGT ACCGCGCCCT GCGGGACGTC TCCGGAGCAT ATCTCGGCTG CCTCGAGGTC 
ACGCAGGACC TCACCGAGAA GCGCGCGCTC GCCGGCGAGC AACGGCTCCT CTCGTGGGAG 
GCCACCGCGC AGCAGGCCAG CGCGCCGGTG CAGGCGTGCC CGGCGCACCC AGGGGCCCCG 
TCCGCCGCCG CGCCGCACCC GGCACGGGCC GAATCGGCGG CCGCGAGGCC TGCCTGGCTC 
GAGGGCGCAC GCGTCTCCAG GTCGCTCGAC GCGCGCCCGC TCCTCGCCGC CGGCGCGCAC 
CCGGTGCAGG AGGTGATGCA GGAGCTCGCC ACGCTCGCCC CGGGCGCCGT CTTCGAGCTC 
GTCGCTCCGT TCGTGCCCGG CCCGCTCCTC GAGCGGGCGC GCGCCGCCGG CTGCCTCGCG 
CACTCGGAGC AGGAGGCGCC GGGGCTGGTG AGGACGTGGT TCACGCGGGG TGGGGCGGCG 
TAA

Protein sequence

MALARTLLSG RRMSELIETG APPRKDLLKH LILQLHGGVA PDAVQRQLVR LLGQVPYGLV 
VEVEQELLAD GMPAAEVTRL CHLHSAALQG AIDLSGVRTP PAGHPARVFS EENAALAKQV 
QALEHAADAL DAVVSEGGAG VHLLQARVRV NALTDVEKHY LRKEHLLFPF LERHGITGPP 
QVMWGKHDQT RALLRAAHAA LASAAGDPAA ARALSDGALR PLASAIRDMV DKEENILLPM 
ALDVLDEREW WEIARQSDEI GYCLVEPEAS WRPDSVDATE AAAPAARVKL PTGSLAPAEL 
EAILGALPLD ATFVDAEDRV RWFSHGKERV FSRSRAVIGR KVQFCHPPSS VGTVETILAG 
FRAGTQDRAS FWIQLRGRFV HIEYRALRDV SGAYLGCLEV TQDLTEKRAL AGEQRLLSWE 
ATAQQASAPV QACPAHPGAP SAAAPHPARA ESAAARPAWL EGARVSRSLD ARPLLAAGAH 
PVQEVMQELA TLAPGAVFEL VAPFVPGPLL ERARAAGCLA HSEQEAPGLV RTWFTRGGAA