Gene Rleg_0209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0209
Symbol
ID	8015412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	220085
End bp	221131
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	60%
IMG OID	644822802
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002974059
Protein GI	241202963
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.120111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.224068
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACTATC TTGGTAAGAT TCGTGCGCGC TCTGTACAAG TTTCTGCTCG TGATGCAAAT 
TGTCCTTCCG GAATACATCG CGCTCCCAAG AGAGTTCTTG TCACCGGCGG TGCAGGTTTC 
CTCGGATCGC ATCTCTGCGA GACGCTTTTG GCCGCCGGAC ACCAGGTGAT CTGCCTCGAC 
AACTTTTCCA CCGGCATGCG GCGCAATATC GTCCATCTGA AGCGAGTCGA TCGCTTCAAT 
GTCGTCGCCC ACGATATCGT CCACCCGCTC GATCTGGAAG TCGACGAGAT CTATAACCTC 
GCCTGCCCGG CATCGCCCCC GCATTATCAG GCCGATCCGA TCCATACGAC AAAGACCTGC 
GTGCTGGGCT CCCTCAACCT TCTGGAGCTG GCCGCGCGCA CCGGCGCACG TATCCTTCAG 
GCATCCACCT CCGAAGTCTA CGGCGACCCG AACGTCCACC CGCAGGTCGA AAGCTACTGG 
GGCAACGTCA ATTCGTTCGG GCCGCGCTCC TGCTATGACG AGGGCAAGCG CTGCGCCGAG 
ACGCTGTTCT TCGACTTCCA CAACACGCAC GGCGTCGAGA TCAAGATCAT CCGCATCTTC 
AACACCTACG GCCCGCGGAT GCGTCCGGAC GACGGCCGCG TCGTCTCGAA TTTCATCGTC 
CAGGCCCTGA CGGGGCAAGA CATCACGATA TATGGCGACG GTTCGCAGAC CCGCTCGTTC 
TGTTTCGTCG ATGATCTCAT CGGCGGCATG GTCCGCATGA TGGCCTCACC GTCGTCGCTG 
ACGGGGCCTG TCAATCTCGG CAATCCGGGC GAATTCACGA TCCGGGAACT GGCCGAGCAG 
GTGATCGGAT TGACCGGTTC CCGGTCGCAA ATCATCCATC GCGCTCTGCC GGTTGACGAT 
CCCCGTCAGC GTCGCCCCGA TATTTCGCTT GCCATGCAGG AACTCGACTG GCGGCCGAAG 
ATCGACTTGT CGAGCGGCCT GCGTCAGACG ATCGACTATT TCGATGGCGT TCTCACCCGT 
CCGGCACGCG AGCTGGAGGC GGTCTGA

Protein sequence

MNYLGKIRAR SVQVSARDAN CPSGIHRAPK RVLVTGGAGF LGSHLCETLL AAGHQVICLD 
NFSTGMRRNI VHLKRVDRFN VVAHDIVHPL DLEVDEIYNL ACPASPPHYQ ADPIHTTKTC 
VLGSLNLLEL AARTGARILQ ASTSEVYGDP NVHPQVESYW GNVNSFGPRS CYDEGKRCAE 
TLFFDFHNTH GVEIKIIRIF NTYGPRMRPD DGRVVSNFIV QALTGQDITI YGDGSQTRSF 
CFVDDLIGGM VRMMASPSSL TGPVNLGNPG EFTIRELAEQ VIGLTGSRSQ IIHRALPVDD 
PRQRRPDISL AMQELDWRPK IDLSSGLRQT IDYFDGVLTR PARELEAV