Gene EcolC_3238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3238
Symbol
ID	6066795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3548591
End bp	3549586
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	55%
IMG OID	641602653
Product	fructokinase
Protein accession	YP_001726187
Protein GI	170021233
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.67247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0186988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAACGA ATTGTCGGCG GCCTTGCATT GCCAATCCGG TTGTCCGTCT CTACGCTATT 
GATATTGAAA AAAATAAGGA GAGTACCGTG CGTATAGGTA TCGATTTAGG CGGCACCAAA 
ACTGAAGTGA TTGCACTGGG CGATGCAGGG GAGCAGTTGT ACCGCCATCG TCTGCCCACG 
CCGCGTGATG ATTACCGGCA GACTATTGAA ACGATCGCCA CGTTGGTTGA TATGGCGGAG 
CAGGCGACGG GGCAGCGCGG AACGGTAGGT ATGGGCATTC CTGGCTCAAT TTCGCCTTAC 
ACCGGTGTGG TGAAGAATGC CAATTCAACC TGGCTCAACG GTCAGCCATT CGATAAAGAC 
TTAAGCGCGA GGTTGCAGCG GGAAGTGCGG CTGGCAAATG ACGCTAACTG TCTGGCGGTT 
TCAGAAGCAG TAGATGGCGC GGCAGCGGGA GCGCAGACGG TATTTGCCGT GATTATCGGC 
ACGGGATGCG GCGCGGGCGT GGCATTCAAT GGGCGGGCGC ATATCGGCGG CAATGGCACG 
GCAGGTGAGT GGGGACACAA TCCGCTACCG TGGATGGACG AAGACGAACT GCGTTATCGC 
GAGGAAGTCC CTTGTTATTG CGGTAAACAA GGTTGTATTG AAACCTTTAT TTCGGGCACG 
GGATTCGCGA TGGATTATCG TCGTTTGAGC GGACATGCGC TGAAAGGCAG TGAAATTATC 
CGCCTGGTTG AAGAAAGCGA TCCGGTAGCG GAACTGGCAT TGCGTCGCTA CGAGCTGCGG 
CTGGCAAAAT CGCTGGCACA TGTCGTGAAT ATTCTCGATC CGGATGTGAT TGTCCTGGGG 
GGCGGGATGA GCAATGTAGA CCGTTTATAT CAAACGGTTG GGCAGTTGAT TAAACAATTT 
GTCTTCGGCG GCGAATGTGA AACGCCGGTG CGTAAGGCGA AGCACGGTGA TTCCAGCGGC 
GTACGCGGCG CTGCGTGGTT ATGGCCACAA GAGTAA

Protein sequence

MITNCRRPCI ANPVVRLYAI DIEKNKESTV RIGIDLGGTK TEVIALGDAG EQLYRHRLPT 
PRDDYRQTIE TIATLVDMAE QATGQRGTVG MGIPGSISPY TGVVKNANST WLNGQPFDKD 
LSARLQREVR LANDANCLAV SEAVDGAAAG AQTVFAVIIG TGCGAGVAFN GRAHIGGNGT 
AGEWGHNPLP WMDEDELRYR EEVPCYCGKQ GCIETFISGT GFAMDYRRLS GHALKGSEII 
RLVEESDPVA ELALRRYELR LAKSLAHVVN ILDPDVIVLG GGMSNVDRLY QTVGQLIKQF 
VFGGECETPV RKAKHGDSSG VRGAAWLWPQ E