Gene EcolC_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0937
Symbol
ID	6068454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1020025
End bp	1021503
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	48%
IMG OID	641600345
Product	carbohydrate kinase FGGY
Protein accession	YP_001723933
Protein GI	170018979
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.101541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAAA AATACATCAT AGGGATTGAT GGCGGAAGTC AGAGCACAAA AGTGGTGATG 
TACGATCTGG AAGGTAATGT GGTTTGCGAA GGTAAAGGCT TATTACAGCC GATGCACACG 
CCAGATGCCG ATACTGCAGA ACATCCTGAC GACGATTTAT GGGCATCATT ATGTTTTGCC 
GGTCACGATT TGATGAGTCA GTTTGCCGGG AATAAAGAAG ATATTGTCGG TATTGGTCTG 
GGATCCATCC GTTGCTGCCG TGCGTTATTG AAAGCCGATG GCACGCCAGC TGCGCCGTTG 
ATTAGCTGGC AGGATGCACG CGTTACACGC CCTTACGAAC ATACGAATCC TGACGTGGCG 
TATGTCACCT CTTTTTCGGG TTATCTGACG CATCGCTTAA CCGGCGAGTT TAAAGACAAT 
ATCGCCAACT ATTTTGGTCA GTGGCCGGTG GATTATAAGA GCTGGGCATG GAGCGAAGAT 
GCTGCGGTAA TGGATAAGTT TAATATCCCC CGTCATATGC TGTTTGATGT GCAAATGCCT 
GGCACCGTCC TCGGACATAT CACACCACAA GCCGCACTGG CGACACATTT CCCGGCAGGA 
CTGCCGGTTG TTTGTACCAC CAGTGATAAA CCGGTAGAAG CTCTGGGGGC TGGATTACTG 
GATGATGAAA CTGCGGTAAT TTCTCTTGGC ACTTACATCG CATTGATGAT GAACGGCAAA 
GCACTGCCGA AAGATCCGGT GGCGTACTGG CCGATTATGT CTTCTATTCC GCAAACATTG 
CTGTATGAAG GTTACGGTAT TCGCAAAGGT ATGTGGACGG TGAGCTGGCT GCGTGACATG 
TTAGGCGAGT CGTTAATTCA GGATGCCAGG GCGCAGGATC TTTCACCGGA AGATTTACTC 
AACAAGAAAG CCTCTAGTGT GCCACCTGGC TGTAATGGGC TGATGACGGT GCTGGACTGG 
CTGACCAATC CGTGGGAACC GTACAAACGC GGGATTATGA TCGGCTTTGA TTCCAGCATG 
GATTACGCAT GGATATATCG TTCGATATTG GAAAGTGTGG CGCTAACGCT GAAGAACAAT 
TACGACAATA TGTGTAATGA AATGAATCAC TTTGCGAAGC ATGTGATCAT TACTGGCGGC 
GGTTCGAACA GCGATCTGTT TATGCAAATT TTTGCCGACG TGTTCAACCT TCCGGCACGC 
CGTAACGCCA TTAACGGTTG TGCAAGTCTG GGAGCAGCGA TTAATACAGC GGTAGGTCTG 
GGGCTATACC CGGATTACGC AACGGCTGTT GATAAGATGG TTCGCGTGAA AGATATCTTT 
ATACCGATTG AGAGCAATGC CAAACGCTAC GACGCGATGA ATAAAGGCAT TTTCAAAGAC 
CTAACCAAAC ATACTGATGT GATCCTGAAA AAATCGTATG AAGTGATGCA TGGGGAATTG 
GGGAATGTGG ATTCGATCCA GAGCTGGTCG AATGCGTAA

Protein sequence

MSKKYIIGID GGSQSTKVVM YDLEGNVVCE GKGLLQPMHT PDADTAEHPD DDLWASLCFA 
GHDLMSQFAG NKEDIVGIGL GSIRCCRALL KADGTPAAPL ISWQDARVTR PYEHTNPDVA 
YVTSFSGYLT HRLTGEFKDN IANYFGQWPV DYKSWAWSED AAVMDKFNIP RHMLFDVQMP 
GTVLGHITPQ AALATHFPAG LPVVCTTSDK PVEALGAGLL DDETAVISLG TYIALMMNGK 
ALPKDPVAYW PIMSSIPQTL LYEGYGIRKG MWTVSWLRDM LGESLIQDAR AQDLSPEDLL 
NKKASSVPPG CNGLMTVLDW LTNPWEPYKR GIMIGFDSSM DYAWIYRSIL ESVALTLKNN 
YDNMCNEMNH FAKHVIITGG GSNSDLFMQI FADVFNLPAR RNAINGCASL GAAINTAVGL 
GLYPDYATAV DKMVRVKDIF IPIESNAKRY DAMNKGIFKD LTKHTDVILK KSYEVMHGEL 
GNVDSIQSWS NA