Gene EcSMS35_4365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4365
Symbol	glpX
ID	6147330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4451997
End bp	4453007
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	56%
IMG OID	641619186
Product	fructose 1,6-bisphosphatase II
Protein accession	YP_001746310
Protein GI	170681842
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1494] Fructose-1,6-bisphosphatase/sedoheptulose 1,7-bisphosphatase and related proteins
TIGRFAM ID	[TIGR00330] fructose-1,6-bisphosphatase, class II

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.732468
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGAG AACTTGCCAT CGAATTTTCC CGCGTCACCG AATCTGCGGC GCTGGCTGGC 
TACAAATGGC TAGGACGCGG CGATAAAAAC ACCGCGGACG GCGCAGCGGT AAACGCCATG 
CGTATTATGC TCAACCAGGT CAACATTGAC GGCACCATCG TTATTGGTGA AGGTGAAATC 
GACGAAGCAC CGATGCTCTA CATTGGTGAA AAAGTCGGTA CTGGTCGCGG CGACGCGGTA 
GATATTGCTG TTGATCCGAT TGAAGGCACG CGCATGACGG CGATGGGCCA GGCTAACGCG 
CTGGCGGTGC TGGCTGTTGG CGATAAAGGC TGCTTCCTCA ATGCGCCAGA TATGTATATG 
GAGAAGCTGA TCGTCGGACC GGGAGCCAAA GGCACCATTG ATCTGAACCT GCCGCTGGCG 
GATAACCTGC GCAATGTTGC GGCGGCGCTC GGTAAACCGT TGAGCGAACT GACGGTAACA 
ATTCTGGCTA AACCACGCCA CGATGCCGTT ATCGCTGAAA TGCAGCAACT CGGCGTACGC 
GTATTTGCTA TTCCGGACGG CGACGTTGCG GCCTCAATTC TCACCTGTAT GCCAGACAGC 
GAAGTTGACG TGCTGTACGG TATTGGTGGC GCGCCGGAAG GCGTGGTTTC TGCAGCGGTG 
ATCCGCGCAT TAGATGGTGA CATGAACGGT CGTCTGCTGG CGCGTCATGA CGTCAAAGGC 
GACAACGAAG AGAATCGTCG CATTGGCGAG CAGGAGCTGG CACGCTGCAA AGCAATGGGC 
ATCGAAGCCG GTAAAGTATT GCGTCTGGGC GATATGGCGC GCAGCGATAA CGTCATCTTC 
TCTGCCACCG GTATTACCAA AGGCGATCTG CTGGAAGGCA TTAGCCGCAA AGGCAATATC 
GCGACTACCG AAACGCTGCT GATCCGCGGC AAGTCACGCA CTATTCGCCG CATTCAGTCC 
ATCCACTATC TGGATCGCAA AGACCCGGAA ATGCAGGTGC ACATTCTCTG A

Protein sequence

MRRELAIEFS RVTESAALAG YKWLGRGDKN TADGAAVNAM RIMLNQVNID GTIVIGEGEI 
DEAPMLYIGE KVGTGRGDAV DIAVDPIEGT RMTAMGQANA LAVLAVGDKG CFLNAPDMYM 
EKLIVGPGAK GTIDLNLPLA DNLRNVAAAL GKPLSELTVT ILAKPRHDAV IAEMQQLGVR 
VFAIPDGDVA ASILTCMPDS EVDVLYGIGG APEGVVSAAV IRALDGDMNG RLLARHDVKG 
DNEENRRIGE QELARCKAMG IEAGKVLRLG DMARSDNVIF SATGITKGDL LEGISRKGNI 
ATTETLLIRG KSRTIRRIQS IHYLDRKDPE MQVHIL