Gene EcE24377A_4435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4435
Symbol	rhaB
ID	5589027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4423652
End bp	4425121
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	55%
IMG OID	640928050
Product	rhamnulokinase
Protein accession	YP_001465394
Protein GI	157155428
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID	[TIGR02627] rhamnulokinase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTTTC GCAATTGTGT CGCCGTCGAT CTCGGCGCAT CCAGTGGGCG CGTGATGCTG 
GCGCGTTACG AGCGTGAATG CCGCAGCCTG ACGCTGCGCG AAATCCATCG TTTTAAAAAT 
GGGCTGCATA GCCAGAACGG TTATGTCACC TGGAATGTGG ATAGCCTGGA AAGTGCCATT 
CGCCTTGGAT TAAACAAGGT GTGCGAGGAA GGGATTCGTA TCGATAGCAT TGGGATTGAT 
ACCTGGGGCG TGGACTTTGT GCTGCTCGAC CAACAGGGTC AGCGTGTGGG CCTGCCCGTT 
GCTTATCGCG ATAGCCGCTC CAATGGCCTA ATGGCGCAGG CACAGCAACA ACTCGGCAAA 
CGCGATATTT ATCAACGTAG CGGCATCCAG TTTCTGCCCT TCAATACGCT TTATCAACTG 
CGTGCGCTGA CGGAGCAACA ACCTGAACTT ATTCCACACA TTGCTCACGC TCTGCTGATG 
CCGGATTACT TCAGCTATCG CCTGACCGGC AAGATGAACT GGGAGTACAC CAATGCCACC 
ACCACACAAC TGGTCAATAT CAATAGCGAC GACTGGGACG AGTCGCTACT GGCGTGGAGC 
GGGGCCAACA AAGCCTGGTT TGGTCGCCCG ACGCATCCGG GTAATGTCAT TGGGCACTGG 
ATTTGCCCGC AGGGTAATGA GATTCCGGTG GTCGCCGTTG CCAGCCATGA TACCGCCAGC 
GCGGTTATCG CCTCGCCGTT AAACGGTTCA CGCGCCGCTT ATCTCTCTTC TGGCACCTGG 
TCATTGATGG GCTTCGAAAG CCAGACGCCA TTTACCAATG ACACGGCGCT GGCAGCCAAC 
ATCACCAATG AAGGCGGGGC GGAAGGTCGC TATCGGGTGC TGAAAAATAT TATGGGCTTA 
TGGCTGCTTC AGCGAGTGCT TCAGGAACGG CAAATCAACG ATCTCCCGGC GCTTATCGCC 
GCGACACAGG CACTTCCGGC CTGTCGCTTC ATCATCAATC CCAATGACGA TCGCTTTATT 
AATCCTGAAG CGATGTGCAG CGAAATTCAG GCTGCGTGTC GGGAAACGGC GCAACCGATC 
CCGGAAAGTG ATGCTGAACT GGCGCGCTGT ATTTTCGACA GTCTGGCGCT GCTGTATGCC 
GATGTGTTGC ATGAGCTGGC GCAGCTGCGC GGTGAAGATT TCTCGCAACT GCATATTGTC 
GGCGGCGGCT GCCAGAACAC GCTGCTCAAC CAGCTATGCG CCGATGCCTG CGGTATTCGG 
GTGATCGCCG GGCCTGTTGA AGCCTCAACG CTCGGCAATA TCGGCATCCA GTTAATGACG 
CTGGATGAAC TCAACAATGT GGATGATTTC CGTCAGGTCG TCAGCACCAC CGCGAATCTG 
ACCACCTTTA CCCCTAATCC TGACAGTGAA ATTGCCCACT ATGTGGCGCA GATTCACTCT 
ACACGACAGA CAAAGGAGCT TTGCGCATGA

Protein sequence

MTFRNCVAVD LGASSGRVML ARYERECRSL TLREIHRFKN GLHSQNGYVT WNVDSLESAI 
RLGLNKVCEE GIRIDSIGID TWGVDFVLLD QQGQRVGLPV AYRDSRSNGL MAQAQQQLGK 
RDIYQRSGIQ FLPFNTLYQL RALTEQQPEL IPHIAHALLM PDYFSYRLTG KMNWEYTNAT 
TTQLVNINSD DWDESLLAWS GANKAWFGRP THPGNVIGHW ICPQGNEIPV VAVASHDTAS 
AVIASPLNGS RAAYLSSGTW SLMGFESQTP FTNDTALAAN ITNEGGAEGR YRVLKNIMGL 
WLLQRVLQER QINDLPALIA ATQALPACRF IINPNDDRFI NPEAMCSEIQ AACRETAQPI 
PESDAELARC IFDSLALLYA DVLHELAQLR GEDFSQLHIV GGGCQNTLLN QLCADACGIR 
VIAGPVEAST LGNIGIQLMT LDELNNVDDF RQVVSTTANL TTFTPNPDSE IAHYVAQIHS 
TRQTKELCA