Gene EcSMS35_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1095
Symbol
ID	6144841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1110613
End bp	1111761
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	52%
IMG OID	641615979
Product	galactonate dehydratase
Protein accession	YP_001743171
Protein GI	170680994
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA CCAAAATTAC CACGTATCGT TTACCTCCCC GCTGGATGTT CCTGAAAATT 
GAAACCGATG AAGGCGTGGT CGGCTGGGGC GAGCCCGTGA TCGAAGGCCG CGCCCGTACG 
GTGGAAGCGG CAGTTCACGA GCTGGGTGAC TATTTGATTG GTCAGGATCC ATCGCGCATC 
AATGACTTAT GGCAAGTGAT GTATCGCGCC GGATTTTATC GTGGAGGTCC AATCCTGATG 
AGCGCCATTG CCGGGATCGA CCAGGCGTTA TGGGATATCA AAGGCAAAGT GCTGAATTCG 
CCGGTCTGGC AACTGATGGG CGGCCTGGTG CGTGACAAAA TTAAAGCCTA CAGTTGGGTC 
GGCGGCGATC GTCCGGCGAA TGTTATCGAC GGAATAAAAA TCCTGCGCGA AATCGGTTTT 
GATACCTTCA AACTGAATGG TTGTGAAGAA CTGGGGCTAA TTGATAACTC CCGCGCGGTA 
GATGCGGCGG TCAACACCGT GGCACAAATT CGTGAAGCTT TTGGCAATCA GATTGAGTTT 
GGTCTTGATT TCCACGGTCG CGTCAGCGCG CCGATGGCGA AAGTACTGAT TAAAGAACTG 
GAACCGTATC GCCCGCTGTT TATTGAAGAG CCGGTGCTGG CAGAACAGGC CGAATACTAC 
CCGAAACTGG CGGCACAAAC GCATATTCCA CTGGCGGCGG GTGAGCGCAT GTTCTCACGT 
TTCGATTTTA AACGTGTGCT GGAGGCGGGT GGTATTTCGA TTCTGCAACC GGATCTCTCC 
CACGCAGGCG GTATTACCGA ATGCTACAAA ATTGCCGGAA TGGCAGAAGC CTATGACGTG 
ACCCTTGCGC CGCACTGTCC GCTCGGACCG ATTGCACTGG CAGCTTGCCT GCATATCGAC 
TTTGTTTCCT ATAACGCCGT ACTTCAGGAA CAAAGTATGG GCATTCATTA CAACAAAGGC 
GCGGAGTTAC TCGACTTTGT GAAAAACAAA GAGGACTTCA GCATGGTCGG CGGCTTCTTT 
AAACCGCTAA CGAAACCGGG CTTAGGCGTG GAAATCGACG AAGCTAAAGT TATTGAGTTC 
AGTAAAAATG CCCCGGACTG GCGTAATCCG CTCTGGCGTC ATGAAGATAA CAGCGTAGCA 
GAGTGGTAA

Protein sequence

MKITKITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHELGD YLIGQDPSRI 
NDLWQVMYRA GFYRGGPILM SAIAGIDQAL WDIKGKVLNS PVWQLMGGLV RDKIKAYSWV 
GGDRPANVID GIKILREIGF DTFKLNGCEE LGLIDNSRAV DAAVNTVAQI REAFGNQIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PKLAAQTHIP LAAGERMFSR 
FDFKRVLEAG GISILQPDLS HAGGITECYK IAGMAEAYDV TLAPHCPLGP IALAACLHID 
FVSYNAVLQE QSMGIHYNKG AELLDFVKNK EDFSMVGGFF KPLTKPGLGV EIDEAKVIEF 
SKNAPDWRNP LWRHEDNSVA EW