Gene EcSMS35_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1229
Symbol
ID	6145054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1233044
End bp	1233859
Gene Length	816 bp
Protein Length	271 aa
Translation table	11
GC content	53%
IMG OID	641616108
Product	mannosyl-3-phosphoglycerate phosphatase
Protein accession	YP_001743291
Protein GI	170684226
COG category	[R] General function prediction only
COG ID	[COG3769] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01484] HAD-superfamily hydrolase, subfamily IIB [TIGR01486] mannosyl-3-phosphoglycerate phosphatase family [TIGR02463] mannosyl-3-phosphoglycerate phosphatase-related protein

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000280677
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCAA TTCAACAACC ACTACTGGTT TTTAGCGATC TTGATGGCAC CCTGCTGGAC 
AGTCATAGTT ATGACTGGCA ACCGGCTGCC CCCTGGCTCA GCCGTTTACG CGAAGGGAAT 
GTTCCCGTCA TTCTCTGTAG CAGTAAAACT TCAGCGGAAA TGCTGTACTT GCAAAAAACG 
TTGGGGCTAC AAGGGTTACC GCTGATTGCC GAAAATGGCG CAGTGATCCA GCTTGCTGAA 
CAATGGCAGG ATATAGACGG TTTTCCACGC ATCATCTCAG GTATTAGCCA TGGCGAAATC 
AGCCAGGTTT TAAATACGCT ACGCGAGAAA GAACATTTTA AATTCACGAC TTTCGATGAT 
GTCGACGATG CAACCATCGC CGAATGGACG GGATTAAGCC GTAGCCAGGC GGCGCTGACG 
CAGCTGCATG AGGCGTCGGT AACGCTAATC TGGCGCGACA GTGACGAGCG TATGGCACAA 
TTTACCGCTC GTCTGAACGA ACTGGGCTTA CAGTTTATGC AGGGTGCGCG CTTCTGGCAC 
GTCCTGGATG CCTCTGCCGG AAAAGATCAG GCCGCCAACT GGATTATCGC GACCTATCAA 
CAATTATCAG GCAAACGCCC AACCACACTT GGCCTGGGCG ATGGGCCAAA CGATGCGCCC 
TTACTGGAGG TAATGGATTA CGCGGTGATT GTGAAAGGGC TAAACCGTGA AGGGGTGCAT 
CTGCATGATG AGGATCCGAC CCGCGTCTGG CGAACGCAGC GTGAAGGACC GGAAGGCTGG 
CGTGAAGGGC TGGACCATTT TTTCTCCGCT CGTTAA

Protein sequence

MFSIQQPLLV FSDLDGTLLD SHSYDWQPAA PWLSRLREGN VPVILCSSKT SAEMLYLQKT 
LGLQGLPLIA ENGAVIQLAE QWQDIDGFPR IISGISHGEI SQVLNTLREK EHFKFTTFDD 
VDDATIAEWT GLSRSQAALT QLHEASVTLI WRDSDERMAQ FTARLNELGL QFMQGARFWH 
VLDASAGKDQ AANWIIATYQ QLSGKRPTTL GLGDGPNDAP LLEVMDYAVI VKGLNREGVH 
LHDEDPTRVW RTQREGPEGW REGLDHFFSA R