Gene EcSMS35_1009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1009
Symbol	gmd
ID	6145928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1027253
End bp	1028374
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	55%
IMG OID	641615896
Product	GDP-mannose 4,6-dehydratase
Protein accession	YP_001743088
Protein GI	170680092
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1089] GDP-D-mannose dehydratase
TIGRFAM ID	[TIGR01472] GDP-mannose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAAAG TCGCTCTCAT CACCGGCGTA ACCGGACAAG ACGGTTCTTA CCTGGCAGAG 
TTTCTGCTGG AAAAAGGTTA CGAGGTGCAT GGTATTAAGC GTCGCGCATC GTCATTCAAC 
ACCGAGCGCG TGGATCACAT TTATCAGGAT CCGCACACCT GCAATCCGAA ATTCCATCTG 
CATTATGGCG ACCTGAGTGA TACCTCCAAC CTGACGCGCA TTTTGCGTGA AGTGCAGCCG 
GATGAAGTGT ACAACCTGGG CGCAATGAGC CACGTTGCGG TTTCTTTTGA GTCACCGGAA 
TATACCGCAG ACGTCGATGC GATGGGTACG CTGCGCCTGC TCGAGGCGAT CCGCTTCCTC 
GGTCTGGAAA AGAAAACCCG TTTCTATCAG GCTTCTACTT CTGAACTGTA CGGTCTGGTG 
CAGGAAATTC CGCAGAAAGA GACCACGCCG TTCTACCCAC GCTCTCCGTA TGCGGTCGCC 
AAACTGTACG CCTACTGGAT CACCGTTAAC TACCGCGAAT CCTACGGCAT GTACGCCTGT 
AACGGTATTC TCTTCAACCA TGAATCCCCG CGCCGTGGCG AAACCTTCGT TACCCGCAAA 
ATCACCCGCG CAATCGCCAA CATCGCCCAG GGGCTGGAGT CGTGCCTGTA CCTCGGCAAC 
ATGGATTCCC TGCGTGACTG GGGCCATGCC AAAGACTACG TAAAAATGCA GTGGATGATG 
CTGCAACAGG AACAACCGGA AGATTTCGTT ATTGCTACCG GCGTTCAGTA CTCCGTACGT 
CAGTTCGTGG AAATGGCGGC AGCACAGCTG GGCATCAAAC TGCGCTTTGA AGGCACGGGC 
GTTGAAGAGA AGGGCATTGT GGTTTCCGTC ACCGGGCATG ACGCGCCGGG CGTTAAACCG 
GGTGATGTGA TTATCGCCGT TGACCCGCGT TACTTCCGTC CGGCTGAAGT TGAAACGCTG 
CTCGGCGACC CGACCAAAGC GCACGAAAAA CTGGGCTGGA AACCGGAAAT CACCCTCAGA 
GAGATGGTGT CTGAAATGGT GGCTAATGAC CTCGAAGCGG CGAAAAAACA CTCTCTGCTG 
AAATCTCACG GCTACGACGT GGCGATCGCG CTGGAGTCAT AA

Protein sequence

MSKVALITGV TGQDGSYLAE FLLEKGYEVH GIKRRASSFN TERVDHIYQD PHTCNPKFHL 
HYGDLSDTSN LTRILREVQP DEVYNLGAMS HVAVSFESPE YTADVDAMGT LRLLEAIRFL 
GLEKKTRFYQ ASTSELYGLV QEIPQKETTP FYPRSPYAVA KLYAYWITVN YRESYGMYAC 
NGILFNHESP RRGETFVTRK ITRAIANIAQ GLESCLYLGN MDSLRDWGHA KDYVKMQWMM 
LQQEQPEDFV IATGVQYSVR QFVEMAAAQL GIKLRFEGTG VEEKGIVVSV TGHDAPGVKP 
GDVIIAVDPR YFRPAEVETL LGDPTKAHEK LGWKPEITLR EMVSEMVAND LEAAKKHSLL 
KSHGYDVAIA LES