Gene ECH74115_5355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5355
Symbol	rhaA
ID	6972016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4997796
End bp	4999055
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	56%
IMG OID	643389011
Product	L-rhamnose isomerase
Protein accession	YP_002273420
Protein GI	209395912
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4806] L-rhamnose isomerase
TIGRFAM ID	[TIGR01748] L-rhamnose isomerase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTC AACTGGAACA GGCCTGGGAG CTGGCGAAAC AGCGTTTCGC GGCAGTAGGG 
ATTGATGTCG AGGAGGCGCT GCGCCAACTT GATCGTTTAC CCGTTTCAAT GCACTGCTGG 
CAGGGTGATG ATGTTTCCGG TTTTGAAAAC CCGGAAGGTT CGCTGACCGG AGGGATTCAG 
GCTACTGGCA ATTATCCGGG CAAAGCGCGT AATGCCAGTG AGCTACGTGC CGATCTGGAA 
CAGGCTATGC GGCTGATTCC GGGGCCAAAA CGGCTTAATT TACATGCCAT CTATCTGGAA 
TCAGACACGC CAGTCTCGCG CGACCAGATC AAACCTGAGC ACTTCAAAAA CTGGGTTGAA 
TGGGCGAAAG CCAATCAGCT CGGTCTGGAT TTTAACCCCT CCTGTTTCTC GCATCCGCTA 
AGCGCCGATG GCTTTACGCT TTCCCATGCC GACGACAGCA TTCGCCAGTT CTGGATTGAT 
CACTGCAAGG CCAGCCGCCG CGTTTCGGCC TATTTTGGTG AGCAACTCGG CACACCGTCG 
GTGATGAACA TCTGGATCCC GGATGGCATG AAAGATATCA CCGTTGACCG TCTCGCTCCG 
CGCCAGCGTC TGCTGGCAGC TCTGGATGAG GTGATCAGCG AGAAGCTGGA TCCGGCGCAC 
CATATCGACG CCGTTGAGAG CAAATTGTTT GGCATTGGCG CAGAGAGCTA CACGGTTGGC 
TCCAATGAGT TTTACATGGG GTATGCCACC AGCCGCCAGA CTGCGCTGTG CCTGGACGCC 
GGGCATTTCC ACCCGACTGA AGTGATTTCC GACAAGATTT CCGCCGCCAT GCTGTATGTG 
CCGCAGTTGC TGCTGCACGT CAGCCGTCCG GTTCGCTGGG ACAGCGATCA CGTAGTGCTG 
CTGGATGATG AAACCCAGGC GATTGCCAGT GAGATTGTTC GTCACGATCT GTTTGACCGG 
GTGCATATCG GCCTCGACTT CTTTGATGCC TCTATCAACC GTATTGCTGC GTGGATCATT 
GGTACACGCA ATATGAAAAA AGCCCTGCTG CGTGCGTTGC TGGAACCTAC CGCTGAGCTG 
CGCAAGCTGG AAGCGGCGGG CGATTACACT GCGCGTCTGG CACTGCTGGA AGAGCAGAAA 
TCGTTGCCGT GGCAGGCGGT CTGGGAAATG TATTGCCAAC GTCACGATAC GCCAGCAGGT 
AGCGAATGGC TGGAGAGCGT GCGGGCATAT GAGAAAGAAA CTTTGAGTCG CCGCGGGTAA

Protein sequence

MTTQLEQAWE LAKQRFAAVG IDVEEALRQL DRLPVSMHCW QGDDVSGFEN PEGSLTGGIQ 
ATGNYPGKAR NASELRADLE QAMRLIPGPK RLNLHAIYLE SDTPVSRDQI KPEHFKNWVE 
WAKANQLGLD FNPSCFSHPL SADGFTLSHA DDSIRQFWID HCKASRRVSA YFGEQLGTPS 
VMNIWIPDGM KDITVDRLAP RQRLLAALDE VISEKLDPAH HIDAVESKLF GIGAESYTVG 
SNEFYMGYAT SRQTALCLDA GHFHPTEVIS DKISAAMLYV PQLLLHVSRP VRWDSDHVVL 
LDDETQAIAS EIVRHDLFDR VHIGLDFFDA SINRIAAWII GTRNMKKALL RALLEPTAEL 
RKLEAAGDYT ARLALLEEQK SLPWQAVWEM YCQRHDTPAG SEWLESVRAY EKETLSRRG