Gene Rleg_0222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0222
Symbol
ID	8011447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	232042
End bp	233130
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	65%
IMG OID	644822815
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002974072
Protein GI	241202976
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATC CCTTCAAGCG TCTCGCCCGC AAGGGTCTCT TCCTGTTCGA TCCGGAAACG 
GCGCACGGCA TGTCGATCGC CGCCTTGAAA TCCGGTCTCG TGCCCGCCTG CCAGATCACC 
CCCGATCCGC GCCTGCGCCA GACCGTTGCC GGCCTTACCT TCGAAAATCC GCTCGGCATG 
GCCGCCGGCT ACGACAAGAA TGCCGAGGTG CCGGAGGCGC TGCTGAAGCT CGGTTTCGGC 
TTTACCGAGA TCGGTACGGT GACGCCGAAG CCGCAATCCG GCAATCCGCG CCCGCGCATC 
TTCCGCCTGG TCGAGGATGA AGCCGTCATC AACCGCCTCG GCTTCAACAA TGAAGGCCAT 
GATGCCGCCT TCGGGCACCT CGCCGCGCTG AGGGGCGGGG GCATGATCGG CGTCAATATC 
GGCGCCAACA AGGATAGCGA GGACCGCATC GCCGATTATG TCGCCGGCAT CCGCCGCTTT 
TATTCCGTCG CGCGCTATTT CACCGCCAAC ATCTCCTCGC CGAACACCCC CGGCCTGCGC 
GACCTGCAGG GGCGCGAAAG CCTTGCGGTG CTGTTATCAG CCGTGCTTGC GGCGCGTGAC 
GAAATGGCAG CGGCATCCGG CCGGACGATC CCGGTCTTTC TGAAGATCGC GCCTGATCTG 
ACCGAGGAAG GCATGGACGA TATCGCAGCC GAGGCGCTTT CGCATGGGCT CGACGGGCTG 
ATCGTCTCCA ACACCACGCT GTCGCGCGAC GGCCTCAAGG ATCAGCGCCA GGCGAAGGAG 
GCGGGTGGAC TTTCCGGCGT GCCGCTTTTC GAAAAGTCGA CGGCGGTGCT CGCCAGGATG 
CGCAAGCGCG TCGGCCCTGA TCTGCCGATC ATCGGCGTCG GTGGCGTCTC CTCGGCCGAG 
ACCGCGCTGG AGAAGATCAG GGCGGGCGCC GATCTCGTCC AGCTCTATTC CTGCATGGTC 
TATGAAGGCC CCGGTCTGGC CGGCGATATC GTCCGCGGCC TGTCGAAACT CCTGGACCGC 
GAAAAGGCCG CCTCGATCCG CGACCTGCGT GATGTCAGGC TGGATTATTG GGCGGCGCGG 
AAGGTCTGA

Protein sequence

MIDPFKRLAR KGLFLFDPET AHGMSIAALK SGLVPACQIT PDPRLRQTVA GLTFENPLGM 
AAGYDKNAEV PEALLKLGFG FTEIGTVTPK PQSGNPRPRI FRLVEDEAVI NRLGFNNEGH 
DAAFGHLAAL RGGGMIGVNI GANKDSEDRI ADYVAGIRRF YSVARYFTAN ISSPNTPGLR 
DLQGRESLAV LLSAVLAARD EMAAASGRTI PVFLKIAPDL TEEGMDDIAA EALSHGLDGL 
IVSNTTLSRD GLKDQRQAKE AGGLSGVPLF EKSTAVLARM RKRVGPDLPI IGVGGVSSAE 
TALEKIRAGA DLVQLYSCMV YEGPGLAGDI VRGLSKLLDR EKAASIRDLR DVRLDYWAAR 
KV