Gene EcolC_1688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1688
Symbol
ID	6066364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1890792
End bp	1891607
Gene Length	816 bp
Protein Length	271 aa
Translation table	11
GC content	53%
IMG OID	641601102
Product	mannosyl-3-phosphoglycerate phosphatase
Protein accession	YP_001724667
Protein GI	170019713
COG category	[R] General function prediction only
COG ID	[COG3769] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01484] HAD-superfamily hydrolase, subfamily IIB [TIGR01486] mannosyl-3-phosphoglycerate phosphatase family [TIGR02463] mannosyl-3-phosphoglycerate phosphatase-related protein

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000570883
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000939338
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTTTTCAA TTCAACAACC ACTACTGGTT TTTAGCGATC TTGATGGCAC CCTGCTGGAC 
AGTCATAGTT ATGACTGGCA ACCGGCTGCC CCCTGGCTCA GCCGTTTACG CGAAGCGAAT 
GTTCCCGTCA TTCTCTGTAG CAGTAAAACT TCAGCGGAAA TGCTGTACTT GCAAAAAACG 
TTGGGGCTAC AAGGGTTACC GCTGATTGCC GAAAATGGCG CAGTGATCCA GCTTGCTGAA 
CAATGGCAGG ATATAGACGG TTTTCCACGC ATCATCTCAG GTATTAGCCA TGGCGAAATC 
AGCCAGGTTT TAAATACGCT ACGCGAGAAA GAACATTTTA AATTCACGAC TTTCGATGAT 
GTCGACGATG CAACCATCGC CGAATGGACG GGATTAAGCC GTAGCCAGGC GGCGCTGACG 
CAGCTGCATG AGGCGTCGGT AACGCTAATC TGGCGCGACA GTGACGAGCG TATGGCACAA 
TTTACCGCTC GTCTGAACGA ACTGGGCTTA CAGTTTATGC AGGGTGCGCG CTTCTGGCAC 
GTCCTGGATG CCTCTGCCGG AAAAGATCAG GCCGCCAACT GGATTATCGC GACCTATCAA 
CAATTATCAG GCAAACGCCC AACCACACTT GGCCTGGGCG ATGGGCCAAA CGATGCGCCC 
TTACTGGAGG TAATGGATTA CGCGGTGATT GTGAAAGGGC TAAACCGTGA AGGGGTGCAT 
CTGCATGATG AGGATCCGAC CCGCGTCTGG CGAACGCAGC GTGAAGGACC GGAAGGCTGG 
CGTGAAGGGC TGGACCATTT TTTCTCCGCT CGTTAA

Protein sequence

MFSIQQPLLV FSDLDGTLLD SHSYDWQPAA PWLSRLREAN VPVILCSSKT SAEMLYLQKT 
LGLQGLPLIA ENGAVIQLAE QWQDIDGFPR IISGISHGEI SQVLNTLREK EHFKFTTFDD 
VDDATIAEWT GLSRSQAALT QLHEASVTLI WRDSDERMAQ FTARLNELGL QFMQGARFWH 
VLDASAGKDQ AANWIIATYQ QLSGKRPTTL GLGDGPNDAP LLEVMDYAVI VKGLNREGVH 
LHDEDPTRVW RTQREGPEGW REGLDHFFSA R