Gene Rleg2_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1689
Symbol
ID	6980426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1719389
End bp	1720315
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	63%
IMG OID	643396413
Product	5-dehydro-4-deoxyglucarate dehydratase
Protein accession	YP_002281203
Protein GI	209549286
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR03249] 5-dehydro-4-deoxyglucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.448176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAACC CGATTGAATT GAAGAAGGCC GTCGGTAGTG GTCTCCTCTC GTTTCCGGTG 
ACGCATTTCG ACGATCAGCT GACATTCGAC GAGGCGAAAT ACCGTCGTCA TGTCGAATGG 
CTTTCGGGTT TTGACGCGGC TGCGCTGTTT GCCGCCGGCG GCACGGGAGA GTTCTTCTCC 
CTCAATCCGG CCGAAATCCC GCAGGTCGTC CGCGCCGCCA AGGCCTCGGC CGGCAAGACG 
CCGATCATCT CGGGCACCGG CTACGGCACG TCGCTCGCCA TCGAGATCGC AAAGGCGGCC 
GAGAAGGCAG GCGCGGACGG GCTGCTGCTG CTGCCGCCCT ATCTGATGTT TGCCGAGCAG 
GCCGGCCTGA TCGCCCATGT CAAGGCAGTC TGCCAATCGG TCGGCATCGG CGTCATCGTC 
TATAACCGCG ACAACGCCGT CCTGACCGCC GAGAGCATCG CGCGGCTTGC GGAGGAATGC 
CCGAACCTGA TCGGTTTCAA GGACGGTGTC GGCGATGTCG ACAAGGTGAT CGAGATCACC 
ACGCTGCTCG GCGACCGGCT GGTCTATGTC GGCGGCATGC CGACCCACGA GGTCTATGCG 
CAAGCCTATT TCGCCGCCGG TGTAACGACC TATTCCTCGG CCGTCTTCAA CTTCGTCCCG 
GCGCTGGCCC AGCGCTTTTA CGGCGCCTTG CGGACCGGCG ATCAGGCGAC CGTCGACGAA 
ATCCTGAAGA GCTTCTTCTT CCCCTTCGTC GCCTTGCGCA ACCGCAAGAA GGGTTATGCC 
GTCTCGATCA TCAAGGCCGG TCTGCGCGTG CTGGGGCAGA ACCCAGGCCC GGTGCGGCCG 
CCGCTGACGG ATCTCAACCA GGAAGAACTG GCGCTCTTGG ACAAGATCGT CCAGGCCAAC 
GGCGTCTCGC GGATCGCGGC GGAGTAG

Protein sequence

MMNPIELKKA VGSGLLSFPV THFDDQLTFD EAKYRRHVEW LSGFDAAALF AAGGTGEFFS 
LNPAEIPQVV RAAKASAGKT PIISGTGYGT SLAIEIAKAA EKAGADGLLL LPPYLMFAEQ 
AGLIAHVKAV CQSVGIGVIV YNRDNAVLTA ESIARLAEEC PNLIGFKDGV GDVDKVIEIT 
TLLGDRLVYV GGMPTHEVYA QAYFAAGVTT YSSAVFNFVP ALAQRFYGAL RTGDQATVDE 
ILKSFFFPFV ALRNRKKGYA VSIIKAGLRV LGQNPGPVRP PLTDLNQEEL ALLDKIVQAN 
GVSRIAAE