Gene RPD_0788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0788
Symbol
ID	4021262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	884649
End bp	885743
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	637960978
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_567927
Protein GI	91975268
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.564423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGCG CCTTCGACGC CTTCTCGCTG CCGCTGCTGC GCCTGTTCGA CGCCGAGGAC 
GCGCACCGGC TCGCGATCCA GGGATTGCGG CTGCTGCCGC AGGTGAAGCC GCGCCCGGAC 
GATCCCAAGC TCGCGGTGCG CGCTTTCGGG CTGAATTTTC CCAACCCGGT CGGTATCGCG 
GCCGGCTTCG ACAAGAACGC CGAGGCGCCG GATGCGCTGA TGCGGCTCGG CTTCGGCTTC 
GTCGAAATCG GCACCGTGAC GCCGAAACCG CAGGCCGGCA ATCCGCGGCC GCGACTGTTC 
CGGCTGGAGC GCGACGAGGC CGTCATCAAC CGGATGGGCT TCAACAATGA CGGCAGCGAA 
GCGGTGCTGC GGCGGCTCGC GGCGCGGGCG CAGCAAGGCG GAATCCTCGG CGTCAATGTC 
GGCGCCAACA AGGACAGCTC GGACCGCGTC GCCGACTACG TCGCGCTGAT CGAGACCTTC 
GCTCCGGTGG CGAGCTACTT CACCGTCAAC GTCTCGTCGC CGAACACGCC GGGCTTGCGC 
AATCTGCAGC AGGCGGCGGC GCTCGACGAT CTGCTGGCGC GGGTGATCGA AGCCCGCGAG 
CGTGTACGCC CCAGCGCTGG AGATACTCCG GTGCTGCTGA AGATCGCGCC CGATCTCACG 
CTCGGCGAAC TCGACGACGT CGTGCACATC GCCCGTTCGC GAAAGGTCGA CGGCATGATC 
GTCGCCAACA CCACGCTGTC GCGCTCGCCG CTGCTGCGCG AGCGAACGCG GATGAACGAG 
CAGGGCGGCC TCAGCGGCCG GCCGCTATTC CGGCTGTCGA CGAGGATGGT GGCGGAGACC 
TATGTCCGCG CCGAGGGCGC ATTCCCGCTG ATCGGGGTCG GCGGCATCGA CTCCGGCGGC 
GCCGCGCTGA CCAAGATCCG CGCCGGCGCC AGCCTCGTGC AGCTTTACTC GGCGCTGATC 
TACAAGGGCC TCGGCCTGGT CGAGAGCATC AAGACCGATC TCGCCTCGAC GCTGCTACGC 
ACCGGCCGGG ATTCGCTGGC CGAAATCGTG GGCGCCGATG CGCCGACCAT CACCGCCGAA 
GAGTGGCCGG TGTGA

Protein sequence

MIRAFDAFSL PLLRLFDAED AHRLAIQGLR LLPQVKPRPD DPKLAVRAFG LNFPNPVGIA 
AGFDKNAEAP DALMRLGFGF VEIGTVTPKP QAGNPRPRLF RLERDEAVIN RMGFNNDGSE 
AVLRRLAARA QQGGILGVNV GANKDSSDRV ADYVALIETF APVASYFTVN VSSPNTPGLR 
NLQQAAALDD LLARVIEARE RVRPSAGDTP VLLKIAPDLT LGELDDVVHI ARSRKVDGMI 
VANTTLSRSP LLRERTRMNE QGGLSGRPLF RLSTRMVAET YVRAEGAFPL IGVGGIDSGG 
AALTKIRAGA SLVQLYSALI YKGLGLVESI KTDLASTLLR TGRDSLAEIV GADAPTITAE 
EWPV