Gene EcHS_A2703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2703
Symbol
ID	5592325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2721197
End bp	2722390
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	51%
IMG OID	640921821
Product	ROK family protein
Protein accession	YP_001459345
Protein GI	157162027
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCCT GCATTAACAA TCAACAGATT CGCCACAATA ACAAATGCGT GATTCTGGAA 
CTGCTGTACC GGCAAAAGCG CGCCAATAAA TCAACGCTGG CCCGGCTGGC GCAAATTTCG 
ATTCCGGCGG TCAGTAATAT TTTGCAGGAA CTGGAAAGCG AAAAACGGGT GGTGAATATC 
GACGATGAAA GTCAGACGCG CGGGCATAGT AGCGGTACAT GGCTGATTGC GCCGGAAGGT 
GACTGGACGC TGTGCCTGAA CGTGACGCCC ACCAGTATTG AGTGTCAGGT TGCTAATGCT 
TGTTTAAGTC CGAAAGGCGA GTTTGAGTAT TTACAGATTG ATGCACCGAC GCCGCAGGCG 
CTGCTGTCCG AAATCGAAAA ATGCTGGCAT CGCCACCGTA AATTGTGGCC GGACCGTACC 
ATCAACCTGG CGCTGGCAAT CCACGGTCAG GTTGATCCGG TGACCGGCGT GTCGCAAACC 
ATGCCGCAAG CGCCGTGGAC AACGCCGGTT GAGGTAAAGT ATCTGCTGGA AGAGAAGCTC 
GGCATTCGGG TGATGGTCGA TAATGACTGC GTGATGCTGG CGCTCGCGGA GAAATGGCAA 
AATAATTCGC AGGAACGGGA TTTCTGCGTG ATCAACGTTG ATTACGGCAT TGGCTCGTCG 
TTCGTGATTA ACGAGCAAAT TTATCGCGGC AGTTTGTATG GTAGCGGACA GATTGGTCAC 
ACCATCGTTA ATCCGGATGG CGTCGTCTGC GACTGTGGAC GTTACGGCTG CCTGGAAACC 
GTCGCCTCGT TAAGCGCATT AAAAAAACAG GCGCGGGTAT GGCTAAAATC ACAACCGGTT 
AGTACTCAAC TTGATCCTGA AAAACTGACT ACAGCGCAGT TAATCGCTGC CTGGCAAAGT 
GGAGAACCGT GGGTCACCAG CTGGGTTGAC CGCAGTGCCA ATGCCATTGG TTTGAGTCTG 
TATAACTTCC TCAACATCCT CAATATTAAT CAGATTTGGT TGTACGGTCG CAGTTGTGCC 
TTTGGTGAGA ACTGGCTTAA TACTATTATT CGCCAGACAG GATTTAACCC GTTCGACCGC 
GACGAAGGAC CGAGCGTGAA AGCGACGCAA ATTGGCTTCG GGCAATTAAG CCGCGCACAA 
CAGGTGCTGG GAATTGGCTA TTTGTATGTT GAGGCGCAGT TACGACAGAT TTGA

Protein sequence

MRACINNQQI RHNNKCVILE LLYRQKRANK STLARLAQIS IPAVSNILQE LESEKRVVNI 
DDESQTRGHS SGTWLIAPEG DWTLCLNVTP TSIECQVANA CLSPKGEFEY LQIDAPTPQA 
LLSEIEKCWH RHRKLWPDRT INLALAIHGQ VDPVTGVSQT MPQAPWTTPV EVKYLLEEKL 
GIRVMVDNDC VMLALAEKWQ NNSQERDFCV INVDYGIGSS FVINEQIYRG SLYGSGQIGH 
TIVNPDGVVC DCGRYGCLET VASLSALKKQ ARVWLKSQPV STQLDPEKLT TAQLIAAWQS 
GEPWVTSWVD RSANAIGLSL YNFLNILNIN QIWLYGRSCA FGENWLNTII RQTGFNPFDR 
DEGPSVKATQ IGFGQLSRAQ QVLGIGYLYV EAQLRQI