Gene ECH74115_4032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4032
Symbol
ID	6971947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3726410
End bp	3727888
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	49%
IMG OID	643387795
Product	carbohydrate kinase, FGGY family protein
Protein accession	YP_002272238
Protein GI	209399162
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.157439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.426373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAGA AATACATCAT AGGGATTGAT GGCGGAAGTC AGAGCACAAA AGTGGTGATG 
TACGATCTGG AAGGTAACGT GGTTTGCGAA GGCAAAGGTT TATTGCAGCC GATGCACACG 
CCAGATGCCG ATACCGCAGA ACATCCTGAC GACGATTTAT GGGCATCATT ATGTTTTGCC 
GGTCACGATT TGATGAGTCA GTTTGCCGGG AATAAAGAAG ATATTGTCGG TATTGGTCTG 
GGATCCATCC GTTGCTGCCG TGCGTTATTG AAAGCCGATG GCACGCCTGC TGCGCCGTTG 
ATTAGCTGGC AGGATGCACG CGTAACGCGT CCCTACGAAC ACACTAATCC TGACGTGGCC 
TATGTCACCT CTTTTTCGGG TTATCTGACG CATCGCTTAA CCGGCGAGTT TAAAGACAAT 
ATCGCCAACT ATTTTGGTCA GTGGCCGGTG GATTATAAGA GCTGGGCATG GAGCGAAGAT 
GCTGCGGTAA TGGAGAAGTT TAATATCCCC CGTCATATGC TGTTTGATGT GCAAATGCCA 
GGCACTGTTC TTGGACAGAT CACACCACAA GCCGCGCTGG CGACACATTT CCCGGCAGGG 
CTGCCGGTTG TTTGTACCAC CAGTGATAAA CCGGTAGAAG CTCTGGGAGC CGGATTACTG 
GATGATGAAA CGGCGGTGAT TTCACTCGGT ACTTATATCG CGCTGATGAT GAACGGCAAA 
GCCTTGCCGA AAGATCCGGT GGCGTACTGG CCGATTATGT CTTCTATTCC GCAAACATTG 
CTGTATGAAG GTTACGGTAT TCGCAAAGGC ATGTGGACGG TGAGCTGGCT GCGCGACATG 
TTAGGCGAGT CGTTAATTCA GGATGCCAGG GCGCAGGATC TTTCACCGGA AGATTTACTC 
AACAAAAAAG CTTCTTGTGT GCCACCTGGC TGTAATGGGC TGATGACGGT GCTGGACTGG 
CTGACCAATC CGTGGGAACC GTACAAACGC GGGATTATGA TCGGCTTTGA TTCCAGCATG 
GATTACGCAT GGATATATCG TTCGATACTG GAAAGCGTGG CGCTGACGCT GAAGAACAAT 
TACGACAATA TGTGTAATGA AATGAATCAC TTTGCGAAGC ATGTGATCAT TACTGGTGGC 
GGTTCGAACA GCGATCTGTT TATGCAGATT TTTGCCGACG TGTTCAACCT TCCGGCACGA 
CGTAACGCCA TTAACGGTTG TGCAAGTCTG GGGGCAGCGA TCAATACGGC GGTAGGTCTG 
GGGCTATACC CGGATTACGC AACGGCTGTC GACAAAATGG TTCGCGTGAA AGATATCTTT 
ATACCGATTG AGAGCAATGC CAAACGCTAC GACGCGATGA ATAAAGGTAT TTTCAAAGCC 
CTAACCAAAC ATACTGATGT GATCCTGAAA AAATCGTATG AAGTGATGCA TGGGGAATTG 
GGGAATGCGG ATTCGATCCA GAGCTGGTCG AATGCGTAA

Protein sequence

MSKKYIIGID GGSQSTKVVM YDLEGNVVCE GKGLLQPMHT PDADTAEHPD DDLWASLCFA 
GHDLMSQFAG NKEDIVGIGL GSIRCCRALL KADGTPAAPL ISWQDARVTR PYEHTNPDVA 
YVTSFSGYLT HRLTGEFKDN IANYFGQWPV DYKSWAWSED AAVMEKFNIP RHMLFDVQMP 
GTVLGQITPQ AALATHFPAG LPVVCTTSDK PVEALGAGLL DDETAVISLG TYIALMMNGK 
ALPKDPVAYW PIMSSIPQTL LYEGYGIRKG MWTVSWLRDM LGESLIQDAR AQDLSPEDLL 
NKKASCVPPG CNGLMTVLDW LTNPWEPYKR GIMIGFDSSM DYAWIYRSIL ESVALTLKNN 
YDNMCNEMNH FAKHVIITGG GSNSDLFMQI FADVFNLPAR RNAINGCASL GAAINTAVGL 
GLYPDYATAV DKMVRVKDIF IPIESNAKRY DAMNKGIFKA LTKHTDVILK KSYEVMHGEL 
GNADSIQSWS NA