Gene Rleg2_5519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5519
Symbol	eutB
ID	6978613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	1167636
End bp	1168637
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	66%
IMG OID	643394618
Product	threonine dehydratase
Protein accession	YP_002279436
Protein GI	209547518
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR02991] ectoine utilization protein EutB

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0114285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAGCA CCTTGCCCGT TTCGCTGGAG GATATTCGCG CGGCGGCGCG GCGGATCGCC 
GGCCGGATTG TCGAAACACC GATGGTACAG GCAGCATCGC TTTGCGACAT TGCCGGCGTT 
CCCGTCTGGC TGAAGCTCGA ACATCATCAG ACGACCGGCA GCTTCAAGCT GCGCGGGGCG 
ACCAATGCGG TACTCTCCTT ATCGCCGGCG GAACGCTCAC GCGGCGTCGT CGCCGCCTCG 
ACCGGAAATC ACGGCCGGGC GCTTGCCTAT GCGGCGAAGG CTGAAGGTGC CGTCGCAACT 
ATCTGCATGT CGCGCCTGGT GCCAGAGAAC AAGATCTCGG AGATCCGCCG CCTCGGTGCC 
GAAATCCGCA TCGTCGGATC GTCGCAGGAC GAGGCGCAGC TAGAGGTCGA CCGGCTGGTC 
GGCGAAGAAG GGGTGGTCAT GGTCCCGCCC TTCGATCATC CGGCTGTCGT AGCCGGGCAG 
GGGACGCTGG GGCTCGAGAT TCTCGACGCT TTGCCGGAAG CGGCCACGGT TCTGGTGCCT 
CTCTCCGGCG GGGGTCTTGC GGCGGGCGTT GCCGCTGCGA TCAAGGGCGT CAATCCGAAG 
ACGAAGGTGA TCGGCCTGAC GATGGAACGG GGCGCGGCGA TGAAGGCGAG CCTCAATGCC 
GGCCGGCCGG TGCAGGTCGA GGAAAGGCCG AGCCTTGCAG ACTCGCTCGG CGGCGGCATC 
GGCCTCGACA ATCGCGTGAC CTTCGCCATG TGCCGCGCCC TTCTCGACGA CGTCATCCTG 
CTGACGGAGG CGGAAATCGC CGCAGGTATG CGCCACGCCT ATGCCTGCGA GCGGGAGATC 
GTCGAAGGTG CGGGCGCCGT CGGTATCGCG GCGCTGCTTG CGGGAAAGAT CCGCTCCGGC 
GGTCCCGTCG TTGCGATCCT GTCGGGCCGA AATGTCGACA TGGAACAGCA CCGCCGGTTG 
ATCAACGGCG AGGCGGCGAT GTTCGGGGAG GATGGGCGAT GA

Protein sequence

MVSTLPVSLE DIRAAARRIA GRIVETPMVQ AASLCDIAGV PVWLKLEHHQ TTGSFKLRGA 
TNAVLSLSPA ERSRGVVAAS TGNHGRALAY AAKAEGAVAT ICMSRLVPEN KISEIRRLGA 
EIRIVGSSQD EAQLEVDRLV GEEGVVMVPP FDHPAVVAGQ GTLGLEILDA LPEAATVLVP 
LSGGGLAAGV AAAIKGVNPK TKVIGLTMER GAAMKASLNA GRPVQVEERP SLADSLGGGI 
GLDNRVTFAM CRALLDDVIL LTEAEIAAGM RHAYACEREI VEGAGAVGIA ALLAGKIRSG 
GPVVAILSGR NVDMEQHRRL INGEAAMFGE DGR