Gene Rleg_5240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5240
Symbol	eutB
ID	8007414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	651138
End bp	652139
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	65%
IMG OID	644822148
Product	threonine dehydratase
Protein accession	YP_002973408
Protein GI	241113573
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR02991] ectoine utilization protein EutB

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.303967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAGCA CCTTGCCCGT TTCGCTGGAG GATATCCACG CCGCGGCCCG CCGGATTGCC 
GGCCGCGTGC TCTGTACATC GATGGTGCAG TCCGCTTCAC TTGGCGAATT GGCCGGCGCG 
CCTGTCCATC TCAAGCTCGA ACATCATCAG ACGACCGGCA GTTTCAAGCT GCGCGGAGCG 
ACCAACGCGG TGCTTTCTTT GTCGCCGGCG GAGCGCTCGC GCGGCTTCGT CGCGGCCTCG 
ACCGGAAATC ACGGCCGTGC ACTTGCCTAT GCGGCAAAGG CGGAAGGTGC CGTCGCGACC 
ATCTGCATGT CGCGGCTGGT GCCGGAGAAC AAGGTTTCGG AAATCCGCCG CCTCGGTGCC 
GATGTCCGTA TCATCGGAAG GTCGCAAGAC GAAGCGCAGC AGGAGGTCGA CCGGCTGGTG 
CGCGAGGAGG GGCTGGTGAT GGTCCCGCCC TTTGATGATC CTGATGTCGT GGCCGGGCAG 
GGGACACTGG GGCTTGAAAT CATCGACACC TTGCCGGAGG CGGCAATCGT GCTGGTGCCG 
CTCTCGGGCG GCGGCCTGGC GGCCGGCGTT GCCGCCGCGG TCAAAGGCAT CAGCTCGAAG 
ACCAAAGTGA TCGGCCTGAC GATGGAGAAG GGTGCCGCGA TGAAGGCAAG CCTCGATGCT 
AGACGGCCGG TGCAGGTCGA GGAGGTATCG AGCCTTGCCG ACTCGCTCGG CGGCGGCATC 
GGCCTCGACA ATCGCGTGAC CTTGGCCATG TGCCGAGACC TTCTCGACGA GGTCATCCTG 
CTGACGGAAG CGGAAATCGC CGCCGGCATG CGCCATGCCT ATGCCTGCGA ACGCCAAATC 
GTCGAAGGCG CGGGCGCGGT CGGCATTGCA GCGCTTCTTG CCGGGAAAAT TGTGGGGAAC 
GGTCCCATCG TCGCGATCCT GTCCGGGCAG AATGTCGACA TGGAACAGCA CAGGCGGGTG 
ATCAATGGCA AGGCGGCACT CTGTGGGGAG GAGGGACCAT GA

Protein sequence

MVSTLPVSLE DIHAAARRIA GRVLCTSMVQ SASLGELAGA PVHLKLEHHQ TTGSFKLRGA 
TNAVLSLSPA ERSRGFVAAS TGNHGRALAY AAKAEGAVAT ICMSRLVPEN KVSEIRRLGA 
DVRIIGRSQD EAQQEVDRLV REEGLVMVPP FDDPDVVAGQ GTLGLEIIDT LPEAAIVLVP 
LSGGGLAAGV AAAVKGISSK TKVIGLTMEK GAAMKASLDA RRPVQVEEVS SLADSLGGGI 
GLDNRVTLAM CRDLLDEVIL LTEAEIAAGM RHAYACERQI VEGAGAVGIA ALLAGKIVGN 
GPIVAILSGQ NVDMEQHRRV INGKAALCGE EGP