Gene EcSMS35_3661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3661
Symbol	gph
ID	6145268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3720420
End bp	3721178
Gene Length	759 bp
Protein Length	252 aa
Translation table	11
GC content	52%
IMG OID	641618488
Product	phosphoglycolate phosphatase
Protein accession	YP_001745628
Protein GI	170681789
COG category	[R] General function prediction only
COG ID	[COG0546] Predicted phosphatases
TIGRFAM ID	[TIGR01449] 2-phosphoglycolate phosphatase, prokaryotic [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED [TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.29844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.025681
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGT TTGAAGATAT TCGCGGCGTC GCTTTTGATC TCGACGGTAC GCTGGTGGAC 
AGTGCTCCTG GCTTGGCTAC CGCAGTAGAT ATGGCGCTGT ATGCGCTGGA GTTGCCCGTC 
GCAGGTGAAG AACGCGTTAT AACCTGGATT GGTAACGGCG CAGATGTTCT GATGGAGCGC 
GCATTGACCT GGGCGCGTCA GGAACGTGCG ACTCTGCGTA AAACAATGGG TAAACCGCCC 
GTTGATGACG ACATTCCGGC AGAAGAACAA GTACGTATTC TGCGTAAACT GTTCGATCGC 
TACTATGGCG AGGTTGCCGA AGAGGGGACG TTTTTGTTCC CGCACGTTGC CGATACGCTG 
GGCGCATTGC AGGCTAAAGG CCTGCCGCTA GGTCTGGTCA CCAACAAACC GACGCCGTTC 
GTCGCGCCGC TGCTCGAAGC CTTAGATATC GCCAAATACT TCAGCGTGGT AATTGGTGGT 
GATGATGTGC AAAACAAAAA ACCGCATCCG GACCCGCTGT TACTGGTGGC TGAGCGGATG 
GGAATTGCTC CACAACAGAT GCTGTTTGTT GGCGACTCAC GCAATGATAT TCAGGCAGCA 
AAAGCGGCAG GTTGCCCATC AGTTGGCTTA ACCTACGGAT ATAACTACGG CGAGGCTATC 
GATCTCAGCC AGCCTGATGT AATTTATCAG TCTATAAATG ACCTTCTGCC CGCATTAGGG 
CTTCCGCATA GCGAAAATCA GGAATCGAAA AATGACTAA

Protein sequence

MNKFEDIRGV AFDLDGTLVD SAPGLATAVD MALYALELPV AGEERVITWI GNGADVLMER 
ALTWARQERA TLRKTMGKPP VDDDIPAEEQ VRILRKLFDR YYGEVAEEGT FLFPHVADTL 
GALQAKGLPL GLVTNKPTPF VAPLLEALDI AKYFSVVIGG DDVQNKKPHP DPLLLVAERM 
GIAPQQMLFV GDSRNDIQAA KAAGCPSVGL TYGYNYGEAI DLSQPDVIYQ SINDLLPALG 
LPHSENQESK ND