Gene Rleg_1597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1597
Symbol
ID	8012672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1588032
End bp	1589282
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	62%
IMG OID	644824183
Product	threonine dehydratase
Protein accession	YP_002975424
Protein GI	241204328
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR02079] threonine dehydratase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGAAAC TTGATGTCGA AAGTGCCGAA GAGGCAATGC GCAGCCTGTT TCCGGCAACG 
CCGCTGCAGC TCAATGATCA TCTGTCGGCC CGCTACGGGG CCGATATCTG GCTGAAGCGC 
GAGGATCTGT CGCCGGTGCG CTCCTATAAG ATCCGCGGCG CCTTCAATTT CTTCCGCAAG 
GCGATCGGGC AGGGTGCGGC CGGCAAGACC TTCGTCTGCG CCTCGGCCGG TAATCACGCC 
CAGGGCTTTG CCTTCGTCTG CCGCCATTTC GGCGTGCCGG GCGTCGTCTT CATGCCGGTG 
ACGACACCGC AGCAGAAGAT CGACAAAACG CGTATGTTCG GCGCCGAATT CATCACCATC 
CGGCTGTTCG GCGACTTCTT CGACCAGTGC TACCAGGCCG CGCGCGAACA CGTAGAGGCG 
GTCGGCGGTG TCATGGTGCC GCCTTTCGAC CATGCCGACA TCATCGAAGG CCAGGCGACG 
GTGGCCGCCG AAATCATGCA GCAGCTGCCG GAAGGAACGG TGCCAGACAT GGTCGTCCTG 
CCGGTCGGCG GCGGCGGACT TGCTGCCGGC ATCACCGGCT ATCTCGACGG CACCGTGCCA 
AAATCGGCTT TTGTCTTCAC CGAACCAGCC GGCGCGCCGA GCCTTAAGCG CAGCATTGAG 
GCGGGCGCGG TAGTGACACT TGCCAAGGTC GACAATTTCG TCGACGGCGC GGCGGTGGGG 
CGCATTGGCG ACCTGAACTT CGCCGCTCTT CGCGATTTCC CGGCAAGCCA AGTGCAACTG 
ATGCCGGAGA ACGCCATCTG CGTCACCATT CAGGAAATGC TGAATGTCGA AGGCGTCGTG 
CTGGAGCCGG CCGGCGCCCT GTCGCTGACG GCGATCGCCG CGATGGACGT CCAAGCGATC 
CGCGGCAAGA CCATCGTCGC TGTCGTCTCC GGCGGCAATT TCGATTTCGA GCGCCTGCCT 
GACGTAAAGG AAAGAGCCAT GCGTTACGCA GGGCTGAAGA AATATTTCAT CCTGCGCCTC 
GCCCAGCGCC CCGGCGCGCT GCGGGATTTC CTCAATCTGC TCGGCCCCGA CGACGATATC 
GCCCGCTTCG AATATCTGAA GAAATCGGCG CGCAACTTCG GCTCCATCCT GATCGGAATC 
GAAACCAAGG CGCCAGAGAA TTTCGCCCGG CTGATCGGAA ATTTCGAAGC AGCCGGCATG 
GGTTACGAGG ATATCACCGA AAACGAGATC CTCGCCAACC TGATCATTTG A

Protein sequence

MTKLDVESAE EAMRSLFPAT PLQLNDHLSA RYGADIWLKR EDLSPVRSYK IRGAFNFFRK 
AIGQGAAGKT FVCASAGNHA QGFAFVCRHF GVPGVVFMPV TTPQQKIDKT RMFGAEFITI 
RLFGDFFDQC YQAAREHVEA VGGVMVPPFD HADIIEGQAT VAAEIMQQLP EGTVPDMVVL 
PVGGGGLAAG ITGYLDGTVP KSAFVFTEPA GAPSLKRSIE AGAVVTLAKV DNFVDGAAVG 
RIGDLNFAAL RDFPASQVQL MPENAICVTI QEMLNVEGVV LEPAGALSLT AIAAMDVQAI 
RGKTIVAVVS GGNFDFERLP DVKERAMRYA GLKKYFILRL AQRPGALRDF LNLLGPDDDI 
ARFEYLKKSA RNFGSILIGI ETKAPENFAR LIGNFEAAGM GYEDITENEI LANLII