Gene ECH74115_3674 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3674
Symbol	eutG
ID	6971371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3388637
End bp	3389824
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	59%
IMG OID	643387468
Product	ethanolamine utilization protein EutG
Protein accession	YP_002271921
Protein GI	209395898
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAATG AATTGCAGAC CGCGCTCTTT CAGGCGTTCG ATACCCTGAA TCTGCAACGG 
GTAAAAACAT TTAGCGTTCC ACCGGTGACG CTTTGCGGTC CGGGCTCGGT GAGCAGTTGC 
GGACAGCAAG CGCAAACGCG TGGGCTGAAA CATCTGTTCG TGATGGCAGA CAGCTTTTTG 
CATCAGGCAG GGATGACCGC CGGGCTGACG CGTAGCCTGG CCGTTAAAGG TATCGCCATG 
ACGCTCTGGC CATGTCCGGT GGGCGAACCG TGCATTACCG ACGTGTGTGC AGCCGTGGCG 
CAGTTGCGTG AGTCAGGTTG TGACGGGGTG ATCGCATTTG GCGGCGGCTC GGTGCTGGAT 
GCGGCGAAAG CCGTGGCGTT GCTGGTGACG AACCCGGATA GCACGCTGGC AGAGATGTCA 
GAAACCAGCG TTCTGCAACC GCGCTTGCCG CTGATTGCCA TTCCAACTAC CGCCGGAACC 
GGCTCTGAAA CCACCAATGT AACGGTGATT ATCGACGCGG TGAGCGGGCG CAAGCAGGTG 
TTAGCCCATG CCTCGCTGAT GCCGGATGTG GCGATCCTCG ACGCCGCATT GACCGAAGGT 
GTGCCGTCGC ATGTCACGGC GATGACCGGC ATTGATGCGT TAACCCATGC CATTGAAGCA 
TACAGCGCCC TGAACGCTAC ACCGTTTACC GACAGTCTGG CGATTGGTGC CATTGCGATG 
ATTGGCAAAT CGCTGCCGAA AGCGGTGGGC TACGGTCACG ACCTTGCCGC GCGCGAGAGC 
ATGTTGCTGG CTTCATGTAT GGCGGGAATG GCGTTTTCCA GTGCGGGTCT TGGGTTGTGC 
CACGCGATGG CGCATCAGCC GGGCGCGGCG CTGCATATTC CGCACGGTCT CGCGAACGCT 
ATGTTGCTGC CAACGGTGAT GGAGTTTAAC CGGATGGTTT GTCGCGAACG CTTTAGTCAG 
ATTGGTCGGG CACTGCGAAC TAAAAAATCC GACGATCGTG ACGCTATTAA CGCGGTAAGT 
GAGCTGATTG CGGAAGTTGG GATTGGTAAA CGACTGGGCG ATGTTGGCGC GACATCTGCG 
CATTACGGTG CATGGGCGCA GGCCGCGCTG GAAGATATTT GTCTGCGCAG CAACCCGCGT 
ACCGCCAGCC TGGAACAGCT TGTCGGCCTG TACGCAGCGG CGCAATAA

Protein sequence

MQNELQTALF QAFDTLNLQR VKTFSVPPVT LCGPGSVSSC GQQAQTRGLK HLFVMADSFL 
HQAGMTAGLT RSLAVKGIAM TLWPCPVGEP CITDVCAAVA QLRESGCDGV IAFGGGSVLD 
AAKAVALLVT NPDSTLAEMS ETSVLQPRLP LIAIPTTAGT GSETTNVTVI IDAVSGRKQV 
LAHASLMPDV AILDAALTEG VPSHVTAMTG IDALTHAIEA YSALNATPFT DSLAIGAIAM 
IGKSLPKAVG YGHDLAARES MLLASCMAGM AFSSAGLGLC HAMAHQPGAA LHIPHGLANA 
MLLPTVMEFN RMVCRERFSQ IGRALRTKKS DDRDAINAVS ELIAEVGIGK RLGDVGATSA 
HYGAWAQAAL EDICLRSNPR TASLEQLVGL YAAAQ