Gene EcSMS35_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2939
Symbol	fucO
ID	6145785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3015164
End bp	3016315
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	54%
IMG OID	641617808
Product	L-1,2-propanediol oxidoreductase
Protein accession	YP_001744963
Protein GI	170682829
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID	[TIGR02638] lactaldehyde reductase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.284503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCTA ACAGAATGAT TCTGAACGAA ACGGCATGGT TTGGTCGGGG TGCTGTTGGG 
GCTTTAACCG ATGAGGTGAA ACGCCGTGGT TATCAGAAGG CGCTGATCGT CACCGATAAA 
ACGCTGGTGC AATGCGGCGT GGTGGCGAAA GTGACCGATA AGATGGATGC TGCAGGGCTG 
GCATGGGCGA TTTACGACGG CGTAGTGCCC AACCCAACAA TTACTGTCGT CAAAGAAGGG 
CTCGGTGTAT TCCAGAATAG CGGCGCGGAT TACCTGATCG CTATTGGTGG CGGTTCTCCA 
CAGGATACGT GTAAAGCGAT TGGCATTATC AGCAACAATC CGGAGTTTGC CGATGTGCGT 
AGCCTGGAAG GGCTTTCCCC GACCAATAAA CCCAGTGTAC CGATTCTGGC AATCCCCACC 
ACAGCAGGTA CTGCGGCAGA AGTGACCATT AACTACGTGA TCACTGACGA AGAAAAACGG 
CGCAAGTTTG TTTGCGTTGA TCCGCATGAT ATCCCGCAGG TGGCGTTTAT TGACGCTGAC 
ATGATGGATG GTATGCCTCC AGCGCTGAAA GCCGCGACGG GTGTCGATGC GCTCACTCAT 
GCTATTGAGG GGTATATTAC CCGTGGCGCG TGGGCGCTAA CCGATGCACT GCACATTAAA 
GCGATTGAAA TCATTGCTGG GGCGCTGCGA GGATCGGTTG CTGGTGATAA GGATGCCGGA 
GAAGAAATGG CGCTCGGGCA GTATGTTGCG GGTATGGGCT TCTCGAATGT TGGGTTAGGG 
TTGGTGCATG GTATGGCGCA TCCACTGGGC GCGTTTTACA ACACGCCACA CGGTGTTGCG 
AACGCCATCC TGTTACCGCA TGTCATGCGC TATAACGCTG ACTTTACCGG TGAGAAGTAC 
CGCGATATCG CGCGCGTTAT GGGCCTGAAA GTGGAAGGTA TGAGCCTGGA AGAGGCGCGT 
AATGCCGCTG TTGAAGCGGT GTTTGCTCTC AACCGTGATG TCGGTATTCC GCCACATTTA 
CGTGATGTTG GTGTACGCAA GGAAGACATT CCGGCACTGG CGCAGGCGGC ACTGGATGAT 
GTTTGTACCG GTGGCAACCC GCGTGAAGCA ACGCTTGAGG ATATTGTAGA GCTTTACCAT 
ACCGCCTGGT AA

Protein sequence

MMANRMILNE TAWFGRGAVG ALTDEVKRRG YQKALIVTDK TLVQCGVVAK VTDKMDAAGL 
AWAIYDGVVP NPTITVVKEG LGVFQNSGAD YLIAIGGGSP QDTCKAIGII SNNPEFADVR 
SLEGLSPTNK PSVPILAIPT TAGTAAEVTI NYVITDEEKR RKFVCVDPHD IPQVAFIDAD 
MMDGMPPALK AATGVDALTH AIEGYITRGA WALTDALHIK AIEIIAGALR GSVAGDKDAG 
EEMALGQYVA GMGFSNVGLG LVHGMAHPLG AFYNTPHGVA NAILLPHVMR YNADFTGEKY 
RDIARVMGLK VEGMSLEEAR NAAVEAVFAL NRDVGIPPHL RDVGVRKEDI PALAQAALDD 
VCTGGNPREA TLEDIVELYH TAW