Gene ECH74115_4826 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4826
Symbol
ID	6968182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4459820
End bp	4461328
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	54%
IMG OID	643388518
Product	carbohydrate kinase, FGGY family
Protein accession	YP_002272946
Protein GI	209398014
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATA ACAGCGCAGC TATCGTTATC GATATTGGCA CCACCAATTG CAAAGTCACC 
TGCTTTTCCT GCCTGGACGC AACGACGTTG GGCGCGCATA AATTCGTGAC GGCAAAGCAG 
ATCTCCCCAC AGGGCGATGT CGATTTCGAT ATCGACGCCC TCTGGCAGGA GGTCCGCCAG 
GCGATAGCGC AACTGAACGC CGCTTCGCCG CTGCCAGTCA GACGGATCAG CATTGCCAGT 
TTTGGCGAAT CAGGCGTGTT CCTTGACGAG CATGGCGAGA TCCTGACGCC AATGCTGGCA 
TGGTATGACC GTCGCGGTGA AGAGTATCTG GCAACGCTTA GCGAGGCAGA CAGTGCGGCA 
CTTTATGACA TCTGCGGTCT ACCACTACAC AGCAATTACT CTGCCTTCAA AATGCGCTGG 
TTGCTGGAAC ATTACCCGCT GCGTAATCGC CGCGGCCTGC GCTGGCTACA TGCGCCGGAA 
GTGCTGCTCT GGCGGCTGAC TGGCGAACAG CACACGGATA TCACCTTAGC CAGCCGCACG 
CTGTGTCTGG ACGTGCGCAA AGGCGAATGG TCAGCGAAAG CGGCGGCGTT GTTACACGTT 
CCCTGTACGG CATTTGCGCC ATTGGTGCAG CCAGGCGAGC ACGCCGGATG GGTCAGCGAG 
TCACTTTGCA AGACGCTTGG GTTCTCGCAA CCGGTCAGCG TGACGCTGGC CGGACATGAC 
CATATGGTGG GTGCGCGAGC GTTGCAGATG ATGCCAGGCG ATATCCTTAA CTCGACGGGG 
ACCACGGAAG GCATTCTGCA ACTGGATACA CAACCGACGC TGGATGAACA GGCCAAACGT 
GACAAGCTGG CAAACGGCTG TTACTCACTT GCCAACCAGT TCACCCTGTT TGCGTCGCTG 
CCCGTGGGCG GTTTCGCGCT GGAGTGGCTG CGCAACACGT TCCGGCTAAC CGATGAGGAG 
ATCGCCGCAT CACTTACTCG CGGACATGCT GATTATCTGG CGGGGAATTG GTTGCTCGAT 
GACATTCCCG TCTTTATTCC ACATCTTCGC GGTTCGGGTT CGCCCTATAA AAATCGCCAT 
ACCCGTGGAT TATTTTATGG GCTTGGCGAT ACGTTAAGTA TCGACATGTT AATTGCCAGC 
GTATCACTGG GATTAACCAT GGAATTTGCC AACTGCTTCG CCTGTTTTAA CGTGCCTGGC 
ACCAGCGCGT TAAAAGTGAT CGGTCCGGCA ACCCATAATC CTCTTTGGCT GCAATTAAAG 
GCGGATATTT TACAGCGTCC GGTTGAAGCA ATTGCATTTA ACGAGGCGGT TTCTGTCGGA 
GCATTATTAA CCGCCGCACC GGATATTCCA CCGCCGCCAG TCGCTATAGC CCAACGTTTG 
TTACCGAATC GGGCGAGATA CCATCAATTA CAGCGTTATC AGCACAAATG GAAAAGCTGG 
TATCAGTTGA AATTACAACA AGAAGGCGTG ATGCCATTAC ATCATCGAGA GGAACACTAT 
GTTGAATAA

Protein sequence

MPDNSAAIVI DIGTTNCKVT CFSCLDATTL GAHKFVTAKQ ISPQGDVDFD IDALWQEVRQ 
AIAQLNAASP LPVRRISIAS FGESGVFLDE HGEILTPMLA WYDRRGEEYL ATLSEADSAA 
LYDICGLPLH SNYSAFKMRW LLEHYPLRNR RGLRWLHAPE VLLWRLTGEQ HTDITLASRT 
LCLDVRKGEW SAKAAALLHV PCTAFAPLVQ PGEHAGWVSE SLCKTLGFSQ PVSVTLAGHD 
HMVGARALQM MPGDILNSTG TTEGILQLDT QPTLDEQAKR DKLANGCYSL ANQFTLFASL 
PVGGFALEWL RNTFRLTDEE IAASLTRGHA DYLAGNWLLD DIPVFIPHLR GSGSPYKNRH 
TRGLFYGLGD TLSIDMLIAS VSLGLTMEFA NCFACFNVPG TSALKVIGPA THNPLWLQLK 
ADILQRPVEA IAFNEAVSVG ALLTAAPDIP PPPVAIAQRL LPNRARYHQL QRYQHKWKSW 
YQLKLQQEGV MPLHHREEHY VE