Gene Rleg_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1810
Symbol
ID	8012868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1801297
End bp	1802313
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	64%
IMG OID	644824401
Product	TIM-barrel protein, nifR3 family
Protein accession	YP_002975634
Protein GI	241204538
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.752321
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.00592071
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTGCCCGA AAGATAATCA TTTGATTTCC AAGGACCTCG CAGCGCCTTT CCAAATCGGA 
CCCGTGTCCG TGCGGAACCG CGTTGTACTG GCGCCGATGT CCGGCGTCAC GGATATGCCC 
TTCCGCGAGC TTGCCTGGCG CTTCGGCGCT GGCCTCGTCG TCACCGAGAT GGTGGCGAGC 
CGTGAACTGG TCAACGACAC GGCCGAATCC TGGTCGCGGC TTAGCGCTGC GGGCTTCCGG 
CCGCATATGG TGCAGCTTGC CGGGCGCGAG GCGCACTGGA TGGCGGAGGC GGCCAAGATC 
GCCGCCGATC ACGGCGCCGA TATCATCGAC ATCAACATGG GTTGCCCGGC AAAGAAAGTG 
ATCGGCGGTT ATTCCGGCTC GGCGCTGATG CGCGATCCCG ATCACGCGCT CGGCCTCATC 
GAGGCGACGG TCAAGGCCGT CGACATTCCG GTGACGCTGA AGATGCGCCT TGGCTGGGAT 
GAGAATTCGA TCAACGCGCC TGATATCGCC CGCCGCGCCG AGGCGGCCGG CATCCAGCTT 
GTGACCATTC ATGGGCGCAC CCGCATGCAA TTCTATGAAG GCCGCGCCGA TTGGGATGCG 
ATCCGCGCCG TCCGCGAGGT GATCTCCATT CCGCTGATCG CCAACGGTGA TGTCGAAACG 
GCAAGCGATG CGCAGGAAAT ATTGCGCCGC TCCGGCGCCG ATGCCGTGAT GATCGGCAGG 
GGCTGCCAGG GCAGGCCATG GCATGCCGGC GTCATATCGG GGGCGCCCGC ACCGCAATCC 
CTGAAGATCG CCGATATCGC CGTCGAGCAT TACCGGATGA TGCTGGATTT CTACGGCGAG 
GCGGTGGCGA TCCGCCATGC CCGCAAGCAC CTTGGCTGGT ATCTCCAGCG TTTCGCGCCT 
GATCTGTCAG GCCCTGAAAA GGCTGAGATC ATGACCTCGC GCGACCCGCG CGAGGTGGCC 
GCGCGCCTTT ACGATGCATT GGCGGCCAGT GTTGTCGACA GCCGGGAGGC GGCATGA

Protein sequence

MCPKDNHLIS KDLAAPFQIG PVSVRNRVVL APMSGVTDMP FRELAWRFGA GLVVTEMVAS 
RELVNDTAES WSRLSAAGFR PHMVQLAGRE AHWMAEAAKI AADHGADIID INMGCPAKKV 
IGGYSGSALM RDPDHALGLI EATVKAVDIP VTLKMRLGWD ENSINAPDIA RRAEAAGIQL 
VTIHGRTRMQ FYEGRADWDA IRAVREVISI PLIANGDVET ASDAQEILRR SGADAVMIGR 
GCQGRPWHAG VISGAPAPQS LKIADIAVEH YRMMLDFYGE AVAIRHARKH LGWYLQRFAP 
DLSGPEKAEI MTSRDPREVA ARLYDALAAS VVDSREAA