Gene Rleg_3235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3235
Symbol
ID	8014126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	3241325
End bp	3242653
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	60%
IMG OID	644825796
Product	nucleotide sugar dehydrogenase
Protein accession	YP_002977023
Protein GI	241205927
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCA CGATGATTGG ATCAGGCTAT GTCGGCCTCG TTTCAGGCGT TTGCTTTGCG 
GATTTCGGCC ACGACGTCAT CTGCGTCGAC AAGGATCTGA GTAAGATCGA AGCCCTTCGC 
GAAGGCCGCA TTCCGATCTA CGAGCCGGGT CTGGAACAAT TGGTCGCCGA AAATACCAGC 
ACCGGCCGAC TGTCGTTTTC GACGGATGTC GGCGAAAGTG TCCGCAGCGC CGATGTCGTG 
TTCATCGCAG TCGGCACGCC GTCCCGGCGC GGCGACGGCC ACGCAGACCT TTCCTATGTC 
TATGCCGCTG CACGCGAGAT TGCCACCTAT GTGGAAGGCT TCACGGTCAT CGTCACCAAG 
TCGACCGTGC CGGTCGGCAC GGGAGACGAG GTCGAGCGCA TCATGCGCGA AACCAATCCT 
GCGGCGGATG TCGCCGTCGT TTCCAATCCG GAATTCCTGC GTGAAGGTGC GGCGATCGAA 
GACTTCAAGC GGCCCGACCG TATCGTCATC GGGCTGAACG ACGACCGGGC GCGCGAAACC 
ATGACCGAGG TCTACCGCCC GCTCTATCTC AACCAGGCCC CCTTGGTCTT CACCACCCGC 
CGCACCTCGG AACTGATCAA ATATGCGGCC AATGCCTTCC TCGCAATGAA GATCACCTTC 
ATCAACGAGA TCGCCGATCT CTGCGAACGG GTCGACGCAA ACGTCCAGGA CGTTTCGCGC 
GGAATCGGTC TCGACGGCCG TATCGGCTCC AAGTTCCTGC ATGCCGGCCC GGGTTACGGC 
GGTTCGTGCT TCCCCAAGGA TACGCTTGCC CTTGCCAAGA CGGCGCAGGA TTACGACGCG 
CCGATGCGTC TCATCGAGAC GACGATCTCG ATCAATGACA ACCGCAAGCG GGCAATGGGA 
CGCAAAGTCA TTTCGGCCGT CGGCGGAGAC ATTCGCGGCA AGAAGATCGC GATCCTCGGC 
CTGACCTTCA AGCCGAACAC CGACGATATG CGCGACAGCC CGGCGATCGC AGTCATCCAG 
ACCCTGCAGG ACAACGGAGC CGAAGTGGTT GGCTACGATC CCGAGGGCAT GGAAAACGCC 
CGTAAGGTGA TCGAGAACAT CGAATATGCG AGCGGCCCTT ATGAAGCAGC CGCTGGTGCG 
GATGCGCTTG TCATCGTCAC CGAATGGAAC CAGTTCCGCG CGCTCGATTT CAATCGCTTG 
AAGCAGTCGA TGCGCGCTCC GATCCTGGTC GATCTGCGCA ATATCTACCG CAGCGACGAG 
GTCCGCAAAC ACGGCTTTAC CTATACCGGC ATCGGCACCA ACCTTTATCA GGACGTGACC 
GGCGCCTGA

Protein sequence

MRITMIGSGY VGLVSGVCFA DFGHDVICVD KDLSKIEALR EGRIPIYEPG LEQLVAENTS 
TGRLSFSTDV GESVRSADVV FIAVGTPSRR GDGHADLSYV YAAAREIATY VEGFTVIVTK 
STVPVGTGDE VERIMRETNP AADVAVVSNP EFLREGAAIE DFKRPDRIVI GLNDDRARET 
MTEVYRPLYL NQAPLVFTTR RTSELIKYAA NAFLAMKITF INEIADLCER VDANVQDVSR 
GIGLDGRIGS KFLHAGPGYG GSCFPKDTLA LAKTAQDYDA PMRLIETTIS INDNRKRAMG 
RKVISAVGGD IRGKKIAILG LTFKPNTDDM RDSPAIAVIQ TLQDNGAEVV GYDPEGMENA 
RKVIENIEYA SGPYEAAAGA DALVIVTEWN QFRALDFNRL KQSMRAPILV DLRNIYRSDE 
VRKHGFTYTG IGTNLYQDVT GA