Gene EcolC_1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1194
Symbol
ID	6065193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1308904
End bp	1310922
Gene Length	2019 bp
Protein Length	672 aa
Translation table	11
GC content	55%
IMG OID	641600609
Product	hydrogenase 4 subunit B
Protein accession	YP_001724187
Protein GI	170019233
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG0651] Formate hydrogenlyase subunit 3/Multisubunit Na+/H+ antiporter, MnhD subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCCC TGCAATTATT AACCTGGTCG CTGATCCTCT ATCTGTTTGC CAGTCTGGCT 
TCGCTGTTTT TACTCGGTCT GGACAGACTG GCTATTAAGC TTTCCGGCAT CACATCGCTG 
GTGGGCGGCG TGATTGGCAT CATCAGCGGA ATTACGCAAT TACATGCTGG TGTAACTTTA 
GTCGCCCATT TTGCCACCCC TTTTGACTTT GCCGATTTAA CCCTGCGAAT GGATAGCCTC 
TCGGCATTTA TGGTGCTGGT TATCTCCTTG CTGGTGGTGG TTTGTTCGCT CTATTCATTG 
ACTTATATGC GCGAATACGA GGGCAAAGGC GCGGCGGCGA TGGGCTTCTT TATGAATCTT 
TTCATCGCAT CGATGGTTGC CCTGCTGGTG ATGGACAACG CTTTTTGGTT CATCGTGCTG 
TTTGAAATGA TGTCGCTGTC TTCCTGGTTT CTGGTCATTG CCAGGCAGGA TAAAACGTCG 
ATCAACGCTG GCATGCTCTA CTTTTTTATC GCCCACGCCG GATCGGTGCT GATAATGATC 
GCCTTCTTGC TGATGGGGCG CGAAAGCGGC AGCCTCGATT TTGCCAGTTT CCGCACGCTT 
TCACTTTCTC CGGGGCTGGC GTCGGCGGTG TTCCTGCTGG CCTTTTTCGG TTTTGGCGCG 
AAAGCCGGGA TGATGCCGTT GCACAGCTGG TTGCCGCGCG CTCACCCTGC CGCACCATCG 
CACGCTTCAG CGTTGATGTC TGGCGTAATG GTCAAAATCG GTATTTTCGG CATCCTGAAA 
GTGGCGATGG ATCTGCTGGC GCAAACGGGT TTGCCGCTGT GGTGGGGCAT TCTGGTGATG 
GCGATCGGCG CAATCTCCGC GCTCCTGGGC GTGCTGTATG CGCTGGCGGA ACAGGATATC 
AAACGGCTAC TGGCCTGGAG TACCGTCGAA AACGTCGGCA TTATTTTGCT GGCGGTCGGT 
GTGGCGATAG TCGGTCTGTC ACTGCACGAC CCGCTGCTCA CCGTGGTTGG ACTGCTCGGC 
GCACTGTTTC ATCTGCTCAA CCATGCGCTG TTCAAAGGGC TGCTATTTCT CGGCGCGGGC 
GCGATTATTT CGCGTTTGCA TACCCACGAC ATGGAAAAAA TGGGGGCACT GGCGAAACGG 
ATGCCGTGGA CAGCCGCAGC ATGCCTGATT GGTTGCCTGG CGATATCAGC CCTTCCTCCG 
CTGAATGGTT TTATCAGCGA ATGGTACACC TGGCAGTCGC TGTTCTCACT AAGTCGTGTG 
GAAGCCGTAG CGCTACAACT TGCGGGTCCT ATTGCTATGG TAATGCTGGC AGTCACTGGT 
GGGCTGGCAG TAATGTGCTT CGTAAAAATG TACGGTATTA CTTTCTGTGG TGCGCCGCGC 
AGTACACACG CTGAAGAGGC ACAGGAAGTG CCAAATACGA TGATCGTCGC CATGCTACTG 
CTCGCGGCAC TCTGCGTATT AATTGCGCTT AGTGCCAGTT GGCTGGCACC GAAGATAATG 
CATATTGCCC ATGCGTTTAC CGATACCCCT CCCGTCACTG TCGCCAGCGG AATAGCACTT 
GTACCCGGCA CGTTTCATAC ACGGGTCACT CCTTCATTAC TGTTGCTGTT ACTACTGGCG 
ATGCCTTTGC TGCCTGGCCT TTACTGGCTG TGGTGTCGTT CGCGCCGCGC AGCGTTTCGT 
CGCACAGGAG ATGCCTGGGC ATGCGGCTAC AGCTGGGAAA ATGCGATGGC CCCGTCAGGC 
AATGGCGTGA TGCAGCCGCT GCGTGTGGTC TTTTCTGCGC TATTTCGTCT ACGACAACAG 
CTCGACCCTA CGCTGAGGCT AAATAAAGGT CTTGCGCACG TCACCGCCAG GGCTCAGAGC 
ACAGAACCCT TCTGGGATGA GCGGGTGATC CGCCCCATCG TGAGCGCCAC CCAACGGCTG 
GCCAAAGAAA TACAGCATCT GCAAAGCGGC GACTTTCGTC TCTATTGCCT GTATGTGGTC 
GCCGCACTGG TTGTGCTGCT AATCGCTATT GCCGTCTAA

Protein sequence

MDALQLLTWS LILYLFASLA SLFLLGLDRL AIKLSGITSL VGGVIGIISG ITQLHAGVTL 
VAHFATPFDF ADLTLRMDSL SAFMVLVISL LVVVCSLYSL TYMREYEGKG AAAMGFFMNL 
FIASMVALLV MDNAFWFIVL FEMMSLSSWF LVIARQDKTS INAGMLYFFI AHAGSVLIMI 
AFLLMGRESG SLDFASFRTL SLSPGLASAV FLLAFFGFGA KAGMMPLHSW LPRAHPAAPS 
HASALMSGVM VKIGIFGILK VAMDLLAQTG LPLWWGILVM AIGAISALLG VLYALAEQDI 
KRLLAWSTVE NVGIILLAVG VAIVGLSLHD PLLTVVGLLG ALFHLLNHAL FKGLLFLGAG 
AIISRLHTHD MEKMGALAKR MPWTAAACLI GCLAISALPP LNGFISEWYT WQSLFSLSRV 
EAVALQLAGP IAMVMLAVTG GLAVMCFVKM YGITFCGAPR STHAEEAQEV PNTMIVAMLL 
LAALCVLIAL SASWLAPKIM HIAHAFTDTP PVTVASGIAL VPGTFHTRVT PSLLLLLLLA 
MPLLPGLYWL WCRSRRAAFR RTGDAWACGY SWENAMAPSG NGVMQPLRVV FSALFRLRQQ 
LDPTLRLNKG LAHVTARAQS TEPFWDERVI RPIVSATQRL AKEIQHLQSG DFRLYCLYVV 
AALVVLLIAI AV