Gene Rleg_4655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4655
Symbol
ID	8007133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	17868
End bp	19205
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	59%
IMG OID	644821591
Product	Epoxide hydrolase domain protein
Protein accession	YP_002972851
Protein GI	241113016
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.246703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGT TTGACAATAT TCGCGCCTGG CGCCGGCTTG CCCGCGGAGC AATGGTGATG 
GCGGTTGGAC CGATGTTGCT GTTCCCAGCC GGTTACCTTG TGCCGGCGAG TGCCGCCGAC 
GTCACATCGG AAGGGCCGGC GACGCCGATC GAGGCCGACG AAACGATCCG CCCGTTCCAG 
ATCCACGTTC CGCAGTCACA GCTTGACGAT CTGCGCAAGC GCATTGCCGA AACGCGTTGG 
CCAGACAAGG AGACCGTGAG CGACACCTCG CAAGGCATCC AGCTTTCGCG CGTCCAGGAT 
CTGGTCCGTT ACTGGGGCAC TGATTACGAT TGGCGCAAAG CCGAGGCTGA GCTCAATGCA 
CTTCCGGAAT TCATCACGAC GATCGACGGG GTCGATATCC AGTTCATCCA TGTGCGATCG 
CGTCATCCCA ACGCCCTTCC GGTCATTTTG ACCCATGGTT GGCCGGGTTC GACCTTCGAG 
TTCATCAAGG CGATCGGCCC TCTTACCGAT CCGACTGCCT ATGGCGGTAA AGCGGAGGAC 
GCATTTGATG TCGTCATCCC TTCCATCCCC GGCTACGGCT TTTCGGGTAA GCCGACGGAG 
CTTGGCTGGG GCCCCGACCG CGTTGCGCGA GCATGGGACA TCCTGATGAA GCGGCTCGGC 
TACGCGCACT ACGTTTCCCA GGGTGGCGAC CATGGTTCCG TTATCTCCGA CGCGCTGGCG 
CGCCAGGCAC CGAAGGGTTT GCTTGGTATC CATCTCAACA TGCCGGCGAC CGTTCCGGGC 
AATCTCACCA AGGCGGTCAA CAGTGGAGAC CCGGCTCCCG CAGGGCTGTC GGCGCCCGAG 
CGGGATGCCT ATGAATCCCT GAGCACCTTT TTTGGCCGGA ATGCCGCCTA TGGGGCCGTG 
ATGGTGACGC GTCCGCAGAC GATCGGCTAC TCGCTTTCCG ACTCGCCGTC GGGCCTAGCT 
GCCTGGATCT ACGAAAAATT TGCGCAATGG AGCGATAGCG AGGGCATTCC CGAGCGTGTT 
TTTTCCAAGG ACGAAATGCT GAATGACATC ACATTGTACT GGCTGACCAA CACTGGGGCA 
TCCTCGTCGC GGTTCTATTG GGAAAACAAC AACAACAACT TCAGCTCAGA CGCCCAGAAG 
ACCAAAGAGA TCAAGATCCC GGTGGCAATC AGCGTATTCC CAAAGGAGAT CTACCAGGCG 
CCGGAGAGTT GGAGCAAGCA GGCCTATCCC ACGCTGCATT ACTACCACCG TGTCGATATG 
GGCGGTCACT TCGCCGCCTG GGAACAGCCC CAACTTTTCG CTGAGGAACT GCGAGAGGCA 
TTCAGATCGG TGCGTTGA

Protein sequence

MKKFDNIRAW RRLARGAMVM AVGPMLLFPA GYLVPASAAD VTSEGPATPI EADETIRPFQ 
IHVPQSQLDD LRKRIAETRW PDKETVSDTS QGIQLSRVQD LVRYWGTDYD WRKAEAELNA 
LPEFITTIDG VDIQFIHVRS RHPNALPVIL THGWPGSTFE FIKAIGPLTD PTAYGGKAED 
AFDVVIPSIP GYGFSGKPTE LGWGPDRVAR AWDILMKRLG YAHYVSQGGD HGSVISDALA 
RQAPKGLLGI HLNMPATVPG NLTKAVNSGD PAPAGLSAPE RDAYESLSTF FGRNAAYGAV 
MVTRPQTIGY SLSDSPSGLA AWIYEKFAQW SDSEGIPERV FSKDEMLNDI TLYWLTNTGA 
SSSRFYWENN NNNFSSDAQK TKEIKIPVAI SVFPKEIYQA PESWSKQAYP TLHYYHRVDM 
GGHFAAWEQP QLFAEELREA FRSVR