Gene Rleg2_0129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0129
Symbol
ID	6978839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	121254
End bp	122294
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	643394840
Product	dihydroorotase
Protein accession	YP_002279657
Protein GI	209547740
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.969204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCGA TCACCATCCG CCGCCCTGAC GACTGGCACC TGCATCTGCG CGATGGCGCG 
ATGCTCGAAG GCGTGATCGC CGATACGAGC CGCACCTTCG CCCGCGCCAT CATCATGCCC 
AATCTCGTGC CGCCCGTCGT CACCACGTCG GATGCGACGG CCTATCGCGA GCGCATTCTG 
AAGGCGCTGC CGGCCGGCCA TCGTTTCCAG CCGCTGATGA CGCTTTATCT CACCGAGCAT 
ACCAGCCCCG ACGATGTCGA AGCCGGTGCC AGGAGCGGCC TCATCACTGC CGTCAAGCTT 
TATCCGGCCG GCGCCACCAC CAATTCGCAT GGCGGCGTCC GCGACATGGA AAAGGCGATG 
CCGGTGCTGG AGCGCATGGC TGCGATTGGC CTGCCGCTCT GCGTCCATGG CGAAGTGACG 
ACGCCTGAGG TCGATATCTT CGATCGCGAA GCCGTCTTCA TCGATACCGT GCTCGATCCG 
CTGCGCCGGC GCCTGCCGGA GCTGAAGGTG ACGATGGAGC ATGTGACGAC ATCGGACGGT 
ATCGACTACA TCAAGGCGGC CAAGGCCAAT CTTGCCGGCT CGATCACCAG CCATCATCTC 
ATCATCAACC GCAACGCCAT CCTCGTCGGC GGTATCCGCC CGCATTATTA TTGCCTGCCG 
GTCGCCAAGC GCGAGAACCA TCGGTTGGCG CTGCGCGCCG CCGCCGTGAG CGGTGACGCC 
CGCTTCTTCC TCGGCACCGA TTCCGCCCCG CATGTCGACC CGCTGAAGGA ATGCGCCTGC 
GGCTGCGCCG GCATCTACAC CTCGATCAAC ACGATGAGCT GCCTTGCGCA TGTCTTCGAG 
GAGGAGGACG CGCTGGACAG GCTCGAAGCC TTCACCTCGC TGAACGGACC GGCCTGGTAC 
GGGCTTCAGC CGAACGAGGA GCGCATCACC CTGTCCAGGC AGGCCGAGCC GGTCGTTTTT 
CCCGCCAAGA TAGAAACCGG CGCCGGTTCG GTGACGGTGT TCGATCCGAT GTATCCGCTG 
CATTGGCACG TTGTGGCGTA G

Protein sequence

MQSITIRRPD DWHLHLRDGA MLEGVIADTS RTFARAIIMP NLVPPVVTTS DATAYRERIL 
KALPAGHRFQ PLMTLYLTEH TSPDDVEAGA RSGLITAVKL YPAGATTNSH GGVRDMEKAM 
PVLERMAAIG LPLCVHGEVT TPEVDIFDRE AVFIDTVLDP LRRRLPELKV TMEHVTTSDG 
IDYIKAAKAN LAGSITSHHL IINRNAILVG GIRPHYYCLP VAKRENHRLA LRAAAVSGDA 
RFFLGTDSAP HVDPLKECAC GCAGIYTSIN TMSCLAHVFE EEDALDRLEA FTSLNGPAWY 
GLQPNEERIT LSRQAEPVVF PAKIETGAGS VTVFDPMYPL HWHVVA