Gene EcSMS35_3072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3072
Symbol	glpX2
ID	6143848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3160195
End bp	3161160
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	56%
IMG OID	641617941
Product	fructose-1,6-bisphosphatase II-like protein
Protein accession	YP_001745092
Protein GI	170680034
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1494] Fructose-1,6-bisphosphatase/sedoheptulose 1,7-bisphosphatase and related proteins
TIGRFAM ID	[TIGR00330] fructose-1,6-bisphosphatase, class II

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0231386
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCCC TGGCGTGGCC ATTATTTCGC GTTACGGAAC AGGCAGCGTT GGCTGCCTGG 
CCGCAAACCG GATGTGGCGA CAAAAATAAA ATTGATGGCC TGGCGGTCAC CGCGATGCGC 
CAGGCATTAA ACGACGTCGC TTTTCGTGGG CGAGTGGTTA TCGGCGAGGG AGAGATTGAC 
CATGCGCCGA TGCTGTGGAT TGGCGAAGAG GTGGGCAAAG GCGATGGGCC AGAAGTCGAT 
ATCGCGGTTG ATCCCATTGA AGGTACGCGG ATGGTGGCGA TGGGGCAGAG CAATGCGCTG 
GCGGTCATGG CTTTCGCACC TCGGGATAGC CTGTTACATG CGCCCGATAT GTATATGAAA 
AAGCTGGTTG TTAATCGACA GGCTGCCGGG GCGATTGATC TGTCTTTGCC TCTGGCGGAC 
AACTTGCGAA ACGTGGCGAA AGCGTTAGGC AAACCGCTGG ACAAACTGCG CATGGTTACG 
CTGGATAAAC CGCGCCTGAG TACCGCAATT GAGGAAGCAA CACAGCTGGG CGTGAAGGTT 
TTTGCCCTGC CGGATGGCGA TGTCGCCGCC AGCGTGCTGA CCTGCTGGCA GGATAATCCT 
TACGATGTGA TGTACACCAT CGGCGGTGCG CCGGAGGGCG TGATTTCTGC CTGTGCCGTT 
AAAGCATTAG GCGGGGATAT GCAGGCCGAG CTGATTGACT TTTGTCAGGC TAAAGGGGAT 
TACACGGAAA ATCGGCAGAT TGCAGAGCAG GAGCGCAAGC GTTGCAAGGA AATGGGCGTT 
GACGTTAACC GTGTGTACTC GCTCGATGAA CTGGTGAGGG GGAACGATAT CCTCTTTAGC 
GCTACGGGCG TGACGGGCGG CGAGTTGGTG AACGGTATCC AACAGACGGC GAATGGGGTG 
CGGACGCAGA CATTACTGAT CGGCGGCGCG GACCAAACGT GTAATATAAT AGACTCCCTG 
CATTGA

Protein sequence

MMSLAWPLFR VTEQAALAAW PQTGCGDKNK IDGLAVTAMR QALNDVAFRG RVVIGEGEID 
HAPMLWIGEE VGKGDGPEVD IAVDPIEGTR MVAMGQSNAL AVMAFAPRDS LLHAPDMYMK 
KLVVNRQAAG AIDLSLPLAD NLRNVAKALG KPLDKLRMVT LDKPRLSTAI EEATQLGVKV 
FALPDGDVAA SVLTCWQDNP YDVMYTIGGA PEGVISACAV KALGGDMQAE LIDFCQAKGD 
YTENRQIAEQ ERKRCKEMGV DVNRVYSLDE LVRGNDILFS ATGVTGGELV NGIQQTANGV 
RTQTLLIGGA DQTCNIIDSL H