Gene EcHS_A4132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4132
Symbol	rhaA
ID	5592695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4122732
End bp	4123991
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	56%
IMG OID	640923234
Product	L-rhamnose isomerase
Protein accession	YP_001460693
Protein GI	157163375
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4806] L-rhamnose isomerase
TIGRFAM ID	[TIGR01748] L-rhamnose isomerase

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACTC AACTGGAACA GGCCTGGGAG CTGGCGAAAC AGCGTTTCGC GGCAGTAGGG 
ATTGATGTCG AGGAGGCGCT GCGCCAACTT GATCGTTTAC CCGTTTCAAT GCACTGCTGG 
CAGGGCGATG ATGTTTCCGG TTTTGAAAAC CCGGAAGGTT CGCTGACCGG TGGGATTCAG 
GCTACTGGTA ATTATCCGGG CAAAGCGCGT AATGCCAGTG AGCTACGAGC CGATCTGGAA 
CAAGCTATGC GGCTGATTCC GGGGCCGAAA CGGCTTAATT TACATGCCAT CTATCTGGAA 
TCAGACACGC CTGTCTCGCG CGATCAGATC AAACCAGAGC ACTTCAAAAA CTGGGTTGAA 
TGGGCGAAAG CCAATCAGCT CGGTCTGGAT TTTAACCCCT CCTGTTTTTC GCATCCGCTA 
AGCGCCGATG GCTTTACGCT TTCCCATGCC GACGACAGCA TTCGCCAGTT CTGGATTGAT 
CACTGCAAAG CTAGCCGTCG CGTTTCGGCC TATTTTGGCG AGCAACTCGG CACACCATCG 
GTGATGAACA TCTGGATCCC GGATGGTATG AAAGATATCA CCGTTGACCG TCTCGCCCCG 
CGTCAGCGTC TGCTGGCAGC ACTGGATGAG GTGATCAGCG AGAAGCTAAA CCCTGCGCAC 
CATATCGACG CCGTTGAGAG CAAATTGTTT GGCATTGGCG CGGAGAGCTA CACGGTTGGC 
TCCAATGAGT TTTACCTGGG GTATGCCACC AGCCGCCAGA CGGCGCTGTG CCTGGACGCC 
GGGCATTTCC ACCCGACTGA AGTGATTTCC GACAAGATTT CCGCCGCCAT GCTGTATGTG 
CCGCAGTTGC TGCTGCACGT CAGCCGTCCG GTTCGCTGGG ACAGCGATCA CGTAGTTCTG 
CTGGATGATG AAACCCAGGC AATTGCCAGT GAGATTGTGC GTCACGATCT GTTTGACCGG 
GTGCATATCG GCCTTGACTT CTTCGATGCC TCTATCAACC GCATTGCCGC GTGGGTCATT 
GGTACACGCA ATATGAAAAA AGCCCTGCTG CGTGCGTTGC TGGAACCTAC CGCTGAGCTG 
CGCAAGCTGG AAGCGGCGGG CGATTACACT GCGCGTCTGG CACTGCTGGA AGAGCAGAAA 
TCGTTGCCGT GGCAGGCGGT CTGGGAAATG TATTGCCAAC GTCACGATAC GCCAGCAGGT 
AGCGAATGGC TGGAGAGCGT GCGGGCTTAT GAGAAAGAAA TTTTGAGTCG CCGCGGGTAA

Protein sequence

MTTQLEQAWE LAKQRFAAVG IDVEEALRQL DRLPVSMHCW QGDDVSGFEN PEGSLTGGIQ 
ATGNYPGKAR NASELRADLE QAMRLIPGPK RLNLHAIYLE SDTPVSRDQI KPEHFKNWVE 
WAKANQLGLD FNPSCFSHPL SADGFTLSHA DDSIRQFWID HCKASRRVSA YFGEQLGTPS 
VMNIWIPDGM KDITVDRLAP RQRLLAALDE VISEKLNPAH HIDAVESKLF GIGAESYTVG 
SNEFYLGYAT SRQTALCLDA GHFHPTEVIS DKISAAMLYV PQLLLHVSRP VRWDSDHVVL 
LDDETQAIAS EIVRHDLFDR VHIGLDFFDA SINRIAAWVI GTRNMKKALL RALLEPTAEL 
RKLEAAGDYT ARLALLEEQK SLPWQAVWEM YCQRHDTPAG SEWLESVRAY EKEILSRRG