Gene Dshi_0847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_0847
Symbol	pyrD2
ID	5711473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	856488
End bp	857546
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	72%
IMG OID	641266756
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001532193
Protein GI	159043399
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.211753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.196757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGC TCGAACGCCT CGGCCTCGCG GCCTTGCAGC GAGTCGATCC CGAAACCGCC 
CATGGCCTGG CGCTGCGCGC GCTGAACGCA GGGCTCGGGC CCCGTTCCGG CCCGGTCACG 
AGCCCGCGGC TCAGCACCCA ACTGGCCGGG CTGCGCCTGC CCAACCCCGT GGGGCTCGCC 
GCCGGGTTCG ACAAGAATGC CGAAACGCTC GGGGCGCTGG CGCAGACCGG CTTCGGGTTT 
CTCGAGGTCG GCGCCGCCAC GCCCCTGCCC CAGCCCGGCA ACCCGCGTCC GCGCCTGTTT 
CGCCTCTCCG AGGACCGCGC CGCGATCAAC CGGTTCGGCT TCAACAATGA CGGGGCCGAG 
GCGATCGCCG CGCGGCTGGC CAGGCGTCCC GAAGGTCGGG TGGTCGGCCT GAACCTCGGC 
GCCAACAAGA CCAGCGCGGA CCGGGCCGGG GATTTCGCCC GGGTGCTCGC CACCTGCGGC 
GCCCATGTGG ATTTCGCGAC GGTCAACGTT TCGTCGCCCA ACACCGAAAA GCTGCGCGAC 
CTGCAAGGCG CCGCCGCCCT GCGCGCGCTG CTGGAGGGGG TGATGGCCGC CCGTGCCGCC 
CTCGTCCGCC CGATCCCGGT GTTCCTCAAG ATCGCCCCGG ACATGGACGA CGCCGCCCTG 
GACGACATCG CCGGCGTAGT GACGGAGGCG GGCCTGCACG GCATCATCGC CACCAACACA 
ACGCTGGCGC GCGACGGGCT CGTCTCGGCC CACAAGGGCG AGGCCGGAGG CCTGTCCGGC 
GCACCGCTCT TCGAGGCGTC GACGCGGGTG CTGGCGCGAC TGTCGCAGGC CACCGAAGGC 
ACTGTCCCGC TGATCGGCGT CGGCGGCGTG GACAGTGCGG GGGCGGCGTA TGCCAAGATC 
CGCGCAGGCG CGTCGGCCGT TCAGCTCTAC ACCGCGCTGG TCTATGGCGG GATCAGCCTC 
GCGGCCGAGA TCGCCACGGG GCTGGACACT CTGCTGGAAC GGGACGGGTT TTCCACCGTG 
GCAGACGCGG TCGGCACGGG ACGAGGAGAC TGGCTATGA

Protein sequence

MSTLERLGLA ALQRVDPETA HGLALRALNA GLGPRSGPVT SPRLSTQLAG LRLPNPVGLA 
AGFDKNAETL GALAQTGFGF LEVGAATPLP QPGNPRPRLF RLSEDRAAIN RFGFNNDGAE 
AIAARLARRP EGRVVGLNLG ANKTSADRAG DFARVLATCG AHVDFATVNV SSPNTEKLRD 
LQGAAALRAL LEGVMAARAA LVRPIPVFLK IAPDMDDAAL DDIAGVVTEA GLHGIIATNT 
TLARDGLVSA HKGEAGGLSG APLFEASTRV LARLSQATEG TVPLIGVGGV DSAGAAYAKI 
RAGASAVQLY TALVYGGISL AAEIATGLDT LLERDGFSTV ADAVGTGRGD WL