Gene Rleg2_6423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6423
Symbol
ID	6983494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011371
Strand	-
Start bp	82326
End bp	83366
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	643399420
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_002284176
Protein GI	209552261
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.544479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGAC ACAAGAGAAT TATGGTTACC GGGGGCACCG GTTTTTTGGG ATCATTCCTG 
TGCGAAAGGC TTTTGCGAGA GGGCAATGAC GTCCTCTGCG TCGACAATTA CTACACCGGT 
TCGCGCGACA ACGTGCTGCA CCTTCTCGAC GATCCACGCT TTGAGATTCT TCGCCACGAC 
ATTACCTTCC CGCTGTACGT GGAGGTCGAC GAGATCTACA ACCTCGCCTG CCCGGCATCT 
CCGGTCCACT ATCAGCACGA CCCCGTGCAG ACAGTGAAGA CCAATGTGCA CGGCGCCATC 
AACATGCTCG GCTTGGCAAA ACGCACCAAG GCCAAGATCT TCCAGGCATC CACCAGCGAA 
GTTTATGGTG ATCCGGCTGT CCACCCTCAA CCCGAGGAGT ATCGAGGCAG CGTCAATCCG 
ATCGGCCCCC GGGCATGTTA TGACGAAGGC AAACGCTGCG CTGAAACATT GTTCTTCGAC 
TATCATCGTC AATACGGTGT GGAAATCCGG GTGGCGCGGA TCTTCAATAC CTATGGACCG 
CGCATGCAGA CCAATGATGG CCGCGTCGTC TCGAACTTCA TCGTTCAGGC GCTTCAAAAC 
CAACCGATCA CTATCTTCGG CAACGGCACG CAGACGCGCT CCTTCTGCTA TGTAGACGAT 
CTGATCGAGG GCTTCATCCG ACTGATGGGG GCGCCGGCCG GCGTTACGGG TCCGATCAAT 
CTCGGTAACC CGGGAGAATT CCAGGTCCGG GAACTGGCCG AAATGGTCAT CGAGATGACG 
GGATCGAAAT CAAGCATCGT GTACAATCCT CTGCCGATTG ACGATCCGAC ACAGCGCAAG 
CCCGACATCA GTCGCGCAAA GCAGGACCTG GGCTGGCAGC CGACGGTGAA CCTGCGAGAG 
GGGCTCGAAA AAACGATCGC GTATTTCGAG TGGAAGCTTT CAGCTGGTGC CAAGAGCGCG 
CCTGTCCGGT CCTCGCGAAA GGCTTACACC TATCTGCCTA CCCCGGCCGT CGGCCTTCCT 
GTTCAGGAAA CCACACGATA G

Protein sequence

MHGHKRIMVT GGTGFLGSFL CERLLREGND VLCVDNYYTG SRDNVLHLLD DPRFEILRHD 
ITFPLYVEVD EIYNLACPAS PVHYQHDPVQ TVKTNVHGAI NMLGLAKRTK AKIFQASTSE 
VYGDPAVHPQ PEEYRGSVNP IGPRACYDEG KRCAETLFFD YHRQYGVEIR VARIFNTYGP 
RMQTNDGRVV SNFIVQALQN QPITIFGNGT QTRSFCYVDD LIEGFIRLMG APAGVTGPIN 
LGNPGEFQVR ELAEMVIEMT GSKSSIVYNP LPIDDPTQRK PDISRAKQDL GWQPTVNLRE 
GLEKTIAYFE WKLSAGAKSA PVRSSRKAYT YLPTPAVGLP VQETTR