Gene Rleg2_1298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1298
Symbol
ID	6980022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1321032
End bp	1322336
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	65%
IMG OID	643396015
Product	dihydroorotase
Protein accession	YP_002280818
Protein GI	209548901
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0828078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00606747
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAACC CGATCGTCCT CCAGAACGTC CGCATCGTCG ATCCCTCGCG CAATCTCGAC 
GAGGTGGGCA CGATCATCGC CGCAAACGGC GTGATCCTTG CTGCCGGAAG CGCCGCGCAG 
AACCAGGGCG CACCCGAAGG TGCCGATATC CGCGACTGCA CCGGCCTTGT CGCCACACCG 
GGCCTCGTCG ATGCGCGCGT CCATATCGGC GAACCCGGCG GCGAGCACCG CGAGACGATC 
GCCTCGGCAA GCCGGGCAGC GGCCGCCGGC GGCGTCACCT CGATCATCAT GATGCCGGAC 
ACAGATCCCG TGATCGACGA CATCGCCCTC GTCGAATTCG TCAAGAAGAC GGCGCGCGAT 
ACCGCCGCCG TCAACGTCTA TCCGGCCGCC GCCCTCACCA AGGGACTTTC CGGCGAGGAA 
ATGACCGAGA TCGGCCTGCT GATGCAGGCA GGCGCCGTCG CCTTCACCGA TGCCCATTCC 
AGCGTCCACG ATACGCAGGT GCTGCGCCGG ATCATGACCT ATGCGCGCGA ATTCGGCGCC 
GTCATCTGCT GCGAAACCCG CGACAAATAT CTCGGCGCCA ACGGCGTCAT GCATGAGGGG 
CTTTTCGCCA GCTGGCTCGG GCTCTCCGGC ATTCCAAGAG AAGCCGAGCT CATCCCGCTC 
GAACGCGATC TCAGGATCGC AGAGCTGACA CGCGGGCGTT ATCATGCCGC GATGATCTCG 
GTGCCGCAAT CGGTCGAGGC GATCGAACGC GCCCGCAGCC GTGGCGCCAA AGTGACCTCG 
GGCATCTCGA TCAACAATCT GGCGCTCAAC GAAAACGACA TCGGCGAATA TCGCACCTTC 
TTCAAGCTCT ATCCGCCGCT GCGCCCGGAA GACGACCGGG TCGCCATGGT CGAGGCGCTG 
GCAAGCGGCG CGATCGATAT CATCGTCTCC TCGCACGACC CGCAGGACGT CGATACGAAG 
CGCCTGCCCT TCGGCGAGGC TGAAGACGGC GCGGTCGGCC TCGAAACCAT GCTGGCGGCG 
GCTCTCAGGC TTCACCATGG CGGCCAGGTG AGCCTGATGC GCCTGATCGA CGCCATGTCC 
ACCCGCCCGG CCGAGATTTT CGGCCTCCCC GCCGGCACGC TGAAGCCGGG GGCTGCGGCC 
GATATCGCGC TGATCGATCT CGATGAGCCT TGGCTTGTCG CCAAAGACAT GCTTCTCTCC 
CGCTCGAAGA ACACGCCGTT CGAAGATGCG CGCTTCAGCG GGCGGGCAAT CGCGACATAC 
GTCTCGGGAA GCTTGTCCAT GCACTCTAGG ACGCGGCTGG ACTGA

Protein sequence

MSNPIVLQNV RIVDPSRNLD EVGTIIAANG VILAAGSAAQ NQGAPEGADI RDCTGLVATP 
GLVDARVHIG EPGGEHRETI ASASRAAAAG GVTSIIMMPD TDPVIDDIAL VEFVKKTARD 
TAAVNVYPAA ALTKGLSGEE MTEIGLLMQA GAVAFTDAHS SVHDTQVLRR IMTYAREFGA 
VICCETRDKY LGANGVMHEG LFASWLGLSG IPREAELIPL ERDLRIAELT RGRYHAAMIS 
VPQSVEAIER ARSRGAKVTS GISINNLALN ENDIGEYRTF FKLYPPLRPE DDRVAMVEAL 
ASGAIDIIVS SHDPQDVDTK RLPFGEAEDG AVGLETMLAA ALRLHHGGQV SLMRLIDAMS 
TRPAEIFGLP AGTLKPGAAA DIALIDLDEP WLVAKDMLLS RSKNTPFEDA RFSGRAIATY 
VSGSLSMHSR TRLD