Gene EcolC_1127 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1127
Symbol
ID	6068004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1228867
End bp	1230060
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	51%
IMG OID	641600543
Product	ROK family protein
Protein accession	YP_001724121
Protein GI	170019167
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCCT GCATTAACAA TCAACAGATC CGCCACCATA ACAAATGCGT GATTCTGGAA 
CTGCTGTACC GGCAAAAGCG CGCCAATAAA TCAACGCTGG CCCGACTGGC GCAAATTTCG 
ATTCCGGCAG TCAGTAATAT TTTGCAGGAA CTGGAAAGCG AAAAACGGGT GGTGAATATC 
GACGATGAAA GCCATACGCG CGGGCATAAT AGCGGTACAT GGCTGATTGC GCCGGAAGGT 
GACTGGACGC TGTGCCTGAA CGTGACGCCC ACCAGTATTG AGTGTCAGGT TGCTAATGCT 
TGTTTAAGTC CGAAAGGTGA ATTTGAGTAT TTACAGATTG ATGCACCGAC GCCGCAGGCG 
CTGCTGTCCG AAATCGAAAA ATGCTGGCAT CGCCACCGTA AATTGTGGCC GGACCATACC 
ATCAACCTGG CGTTGGCAAT CCACGGTCAG GTTGATCCTG TGACCGGCGT GTCGCAAACC 
ATGCCGCAAG CGCCGTGGAC AACGCCGGTG GAGGTGAAAT ATCTGCTGGA AGAGAAGCTC 
GGCATTCGGG TGATGGTCGA TAATGACTGC GTGATGCTGG CGCTGGCGGA GAAATGGCAA 
AATAATTCGC AGGAACGGGA TTTCTGCGTG ATCAACGTTG ATTACGGCAT TGGCTCGTCG 
TTCGTGATTA ACGAGCAAAT TTATCGCGGC AGTTTGTATG GTAGCGGACA GATTGGTCAC 
ACCATCGTTA ATCCGGATGG CGTCGTCTGC GACTGTGGAC GTTATGGCTG CCTGGAAACC 
GTCGCCTCGT TAAGCGCATT AAAAAAACAG GCGCGGGTAT GGCTAAAATC ACAACCGGTT 
AGTACTCAAC TTGATCCTGA AAAACTGACT ACAGCGCAGT TAATCGCTGC CTGGCAAAGT 
GGAGAACCGT GGATCACCAG CTGGGTTGAT CGCTCTGCCA ATGCCATTGG TTTGAGTCTG 
TATAACTTCC TCAACATCCT CAATATTAAT CAGATTTGGT TGTACGGTCG CAGTTGTGCC 
TTTGGTGAGA ACTGGCTTAA TACTATTATT CGCCAGACAG GATTTAACCC GTTCGACCGC 
GACGAAGGAC CGAGCGTGAA AGCGACGCAA ATTGGCTTTG GGCAATTAAG CCGCGCACAA 
CAGGTGCTGG GAATTGGCTA TTTGTATGTT GAGGCGCAGT TACGACAGAT TTGA

Protein sequence

MRACINNQQI RHHNKCVILE LLYRQKRANK STLARLAQIS IPAVSNILQE LESEKRVVNI 
DDESHTRGHN SGTWLIAPEG DWTLCLNVTP TSIECQVANA CLSPKGEFEY LQIDAPTPQA 
LLSEIEKCWH RHRKLWPDHT INLALAIHGQ VDPVTGVSQT MPQAPWTTPV EVKYLLEEKL 
GIRVMVDNDC VMLALAEKWQ NNSQERDFCV INVDYGIGSS FVINEQIYRG SLYGSGQIGH 
TIVNPDGVVC DCGRYGCLET VASLSALKKQ ARVWLKSQPV STQLDPEKLT TAQLIAAWQS 
GEPWITSWVD RSANAIGLSL YNFLNILNIN QIWLYGRSCA FGENWLNTII RQTGFNPFDR 
DEGPSVKATQ IGFGQLSRAQ QVLGIGYLYV EAQLRQI