Gene EcolC_0989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0989
Symbol
ID	6067766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1074821
End bp	1076647
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	58%
IMG OID	641600397
Product	formate hydrogenlyase subunit 3
Protein accession	YP_001723985
Protein GI	170019031
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG0651] Formate hydrogenlyase subunit 3/Multisubunit Na+/H+ antiporter, MnhD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.180245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAA TTTCCCTGAT CAATAGCGGC GTGGCGTGGT TTGTCGCCGC CGCTGTTCTG 
GCATTTCTCT TTTCTTTTCA AAAAGCGTTA AGTGGCTGGA TAGCTGGAAT TGGCGGCGCG 
GTTGGTAGTC TGTATACGGC AGCCGCGGGC TTCACTGTAC TGACTGGCGC GGTTGGCGTG 
AGCGGTGCGC TGTCGCTGGT AAGCTACGAT GTGCAAATCT CTCCGCTTAA CGCGATTTGG 
CTGATTACGC TCGGTCTGTG CGGTCTGTTT GTCAGCCTCT ACAACATTGA CTGGCATCGC 
CACGCGCAGG TGAAGTGCAA CGGCTTGCAG ATCAATATGT TGATGGCTGC CGCCGTCTGC 
GCCGTCATTG CCAGCAACCT CGGCATGTTC GTGGTAATGG CCGAAATCAT GGCCCTGTGC 
GCGGTGTTCC TCACCAGCAA CAGCAAAGAG GGCAAACTGT GGTTTGCGCT GGGGCGTCTT 
GGCACTCTGC TGCTGGCGAT TGCTTGCTGG CTGCTGTGGC AGCGTTACGG CACGCTGGAT 
CTGCGCCTGC TGGATATGCG TATGCAACAG CTGCCGCTCG GTTCCGATAT CTGGCTGCTC 
GGAGTGATTG GCTTTGGCCT GCTGGCCGGG ATTATTCCGC TGCACGGCTG GGTGCCGCAG 
GCACATGCGA ACGCCTCTGC GCCAGCTGCC GCGTTGTTTT CTACGGTAGT CATGAAAATT 
GGCCTGCTGG GCATTTTAAC CCTGTCACTG CTGGGCGGTA ATGCACCGCT GTGGTGGGGG 
ATCGCGCTGC TGGTGCTCGG CATGATCACC GCGTTTGTCG GTGGTCTGTA TGCGCTGATG 
GAGCACAACA TCCAGCGCCT GCTGGCTTAC CACACCCTGG AAAATATCGG CATCATCCTG 
CTGGGGCTGG GCGCTGGCGT AACGGGTATC GCGCTCGAAC AACCGGCGCT GATTGCTCTT 
GGCCTGGTCG GTGGTCTGTA CCATCTGCTT AACCATAGCC TGTTCAAAAG CGTACTGTTC 
CTCGGGGCGG GGAGCGTCTG GTTCCGTACC GGTCATCGCG ATATCGAAAA ACTCGGTGGT 
ATTGGCAAGA AAATGCCGGT TATCTCCATC GCCATGTTAG TCGGGCTGAT GGCAATGGCT 
GCGCTGCCGC CGCTGAATGG TTTTGCCGGG GAATGGGTTA TCTATCAATC ATTTTTCAAA 
CTGAGCAATA GTGGCGCGTT TGTTGCCCGT CTGCTGGGGC CGCTGCTCGC TGTGGGGCTG 
GCAATTACCG GTGCGCTGGC GGTGATGTGT ATGGCGAAAG TCTATGGCGT CACGTTCCTC 
GGCGCGCCGC GTACCAAAGA AGCCGAAAAC GCCACCTGTG CGCCGCTCCT GATGAGCGTA 
AGCGTAGTGG CACTGGCGAT TTGCTGCGTA ATTGGCGGTG TTGCTGCGCC GTGGCTACTG 
CCGATGCTCT CTGCTGCTGT ACCTCTGCCG CTGGAGCCTG CTAACACCAC CGTTTCTCAA 
CCGATGATCA CGTTGCTGCT GATTGCCTAC CCGCTGCTGC CATTCATCAT TATGGCGATT 
TGCAAAGGCG ATCGTTTGCC ATCGCGTTCC CGCGGTGCGG CCTGGGTGTG CGGTTACGAC 
CACGAAAAAT CAATGGTGAT TACCGCTCAC GGTTTTGCCA TGCCGGTGAA ACAGGCGTTT 
GCGCCGGTGC TGAAACTACG CAAATGGCTG AATCCGGTGT CTCTGGTGCC GGGCTGGCAG 
TGCGAGGGGA GTGCGTTGCT GTTCCGCCGG ATGGCGCTGG TTGAACTGGC GGTACTGGTG 
GTGATTATTG TTTCACGAGG AGCCTGA

Protein sequence

MSAISLINSG VAWFVAAAVL AFLFSFQKAL SGWIAGIGGA VGSLYTAAAG FTVLTGAVGV 
SGALSLVSYD VQISPLNAIW LITLGLCGLF VSLYNIDWHR HAQVKCNGLQ INMLMAAAVC 
AVIASNLGMF VVMAEIMALC AVFLTSNSKE GKLWFALGRL GTLLLAIACW LLWQRYGTLD 
LRLLDMRMQQ LPLGSDIWLL GVIGFGLLAG IIPLHGWVPQ AHANASAPAA ALFSTVVMKI 
GLLGILTLSL LGGNAPLWWG IALLVLGMIT AFVGGLYALM EHNIQRLLAY HTLENIGIIL 
LGLGAGVTGI ALEQPALIAL GLVGGLYHLL NHSLFKSVLF LGAGSVWFRT GHRDIEKLGG 
IGKKMPVISI AMLVGLMAMA ALPPLNGFAG EWVIYQSFFK LSNSGAFVAR LLGPLLAVGL 
AITGALAVMC MAKVYGVTFL GAPRTKEAEN ATCAPLLMSV SVVALAICCV IGGVAAPWLL 
PMLSAAVPLP LEPANTTVSQ PMITLLLIAY PLLPFIIMAI CKGDRLPSRS RGAAWVCGYD 
HEKSMVITAH GFAMPVKQAF APVLKLRKWL NPVSLVPGWQ CEGSALLFRR MALVELAVLV 
VIIVSRGA