Gene EcolC_0696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0696
Symbol
ID	6065128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	748307
End bp	749425
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	54%
IMG OID	641600102
Product	hydrogenase 2 small subunit
Protein accession	YP_001723698
Protein GI	170018744
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAG ATAACACCCT CATCCATTCT CACGGCATTA ACCGTCGTGA TTTCATGAAG 
CTTTGTGCAG CATTAGCCGC CACCATGGGG TTAAGTAGCA AAGCCGCTGC AGAGATGGCC 
GAATCGGTTA CTAACCCGCA GCGTCCGCCA GTTATCTGGA TTGGCGCGCA GGAGTGCACC 
GGTTGTACGG AATCTCTGCT TCGTGCAACG CATCCAACGG TAGAAAACCT CGTACTGGAG 
ACTATCTCTC TGGAGTATCA CGAAGTGCTT TCCGCCGCCT TCGGTCATCA GGTCGAAGAG 
AACAAACATA ACGCTCTCGA GAAGTACAAA GGGCAGTATG TGTTAGTGGT GGATGGTTCC 
ATCCCATTAA AAGATAACGG TATTTATTGC ATGGTTGCCG GTGAGCCGAT TGTGGATCAC 
ATCCGCAAAG CGGCGGAAGG CGCAGCAGCC ATTATCGCTA TCGGTTCCTG CTCTGCGTGG 
GGCGGTGTTG CCGCAGCTGG AGTTAACCCA ACTGGCGCAG TCAGCCTGCA AGAAGTTCTG 
CCAGGCAAAA CCGTTATCAA TATTCCGGGC TGCCCGCCGA ACCCGCACAA CTTCCTCGCG 
ACCGTTGCGC ACATCATCAC TTACGGCAAA CCGCCGAAAC TGGATGACAA AAACCGTCCG 
ACCTTCGCCT ATGGCCGTCT GATTCACGAA CACTGCGAAC GTCGCCCGCA CTTCGATGCT 
GGTCGTTTTG CCAAAGAGTT CGGTGATGAA GGCCACCGCG AAGGCTGGTG CCTGTACCAC 
CTCGGCTGTA AAGGGCCAGA AACTTACGGC AACTGCTCAA CGCTGCAATT CTGCGATGTT 
GGCGGTGTGT GGCCGGTGGC GATTGGTCAC CCGTGCTATG GCTGTAACGA AGAAGGTATC 
GGCTTCCATA AAGGCATCCA TCAGCTTGCC AACGTCGAAA ATCAAACTCC GCGTTCACAG 
AAACCGGATG TTAACGCTAA AGAGGGCGGC AACGTCTCTG CAGGCGCTAT TGGTTTGCTC 
GGCGGTGTGG TTGGGTTGGT TGCCGGTGTC AGCGTGATGG CGGTGCGTGA ACTGGGTCGT 
CAGCAAAAGA AAGATAACGC TGACTCACGG GGAGAATAA

Protein sequence

MTGDNTLIHS HGINRRDFMK LCAALAATMG LSSKAAAEMA ESVTNPQRPP VIWIGAQECT 
GCTESLLRAT HPTVENLVLE TISLEYHEVL SAAFGHQVEE NKHNALEKYK GQYVLVVDGS 
IPLKDNGIYC MVAGEPIVDH IRKAAEGAAA IIAIGSCSAW GGVAAAGVNP TGAVSLQEVL 
PGKTVINIPG CPPNPHNFLA TVAHIITYGK PPKLDDKNRP TFAYGRLIHE HCERRPHFDA 
GRFAKEFGDE GHREGWCLYH LGCKGPETYG NCSTLQFCDV GGVWPVAIGH PCYGCNEEGI 
GFHKGIHQLA NVENQTPRSQ KPDVNAKEGG NVSAGAIGLL GGVVGLVAGV SVMAVRELGR 
QQKKDNADSR GE