Gene WD1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD1239
Symbol	pyrD
ID	2737683
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	+
Start bp	1186489
End bp	1187556
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	35%
IMG OID	637173391
Product	dihydroorotate dehydrogenase 2
Protein accession	NP_966951
Protein GI	42521036
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAAA ATAAACTAAA AATAAGCAAA GTGTTTTACA AACGTAATTT ACTATTTTTA 
CTACCGCCCG AAGTTGCTCA CTCTTTGGCA ATTATGGCAT TAAAGAAAAT GCCTTATAAG 
AATCCTATAG AGCTACCAGA ATCTTTGAGT GTGAATTTTT TTGGTAATAA GCTCAGAAGC 
CCCGTAGGTC TGGCTGCAGG TTTTGACAAG AATGCAGAAG TTATAAGGCC TATGCTCTCA 
TTTGGTTTTG GGTTTATTGA AACTGGTACT GTAACTCGTA ATCCACAATA TGGAAACAAA 
AAGCCAAGAA TTTTTCGGTT AATTAAAGAT CAAGGGGTAA TTAACAGATT GGGATTTAAC 
AATAAAGGAA TAGACTATTT TCTTAAACAA ATAGGTGAAA CCAAGCTTGA TGACTGCATT 
TTTGGCATCA ACATAGGAAA AAACAGTACA TCAAAGGACC AAATCAGCGA TTATGTTGAC 
TTAATAAAGA TAGTATATGG AAAGAGCAAT TATATAGTGC TGAACATCTC ATCCCCAAAC 
ACGCCTAATT TACGCAATCT GCACAATAAG CAAGAATTAT CGGAATTGTT GAAATCCGTA 
ACTCTAACCC GAAAATCAAT TGATAATTCT AAATCCATAC CAATAATATT AAAAATCTCA 
CCAGATGTAG ATCAGCAAAC GAAAGAAAAT ATCGCTGAGC TTGCGTTGGA ATATAAGATT 
GACGGATTAA CAGTAAGCAA CACTACGGTA AGTAGAGATA ATCTGCATTC TCACCATAAT 
GAGAGTGGTG GGTTGAGTGG CAAACCGCTG TTTAAACTTT CAACCGAGTT ATTGGGCGAT 
ATGTACAAAT TTACTAAGGG CAAAATATTA TTGATAGGGT GCGGAGGAAT CTCAAGTGGT 
GCTGATGCAT ATAAAAAAAT AAAGGCAGGA GCTTCTTTGG TGCAGTTGTA CACTGCTCTC 
ATATACCACG GACCTCAAGT TGTAAACAAA ATTAATCTAG AACTTGCAGA ACTAATAAGG 
AGAGATGGAT TTAGTAACAT TAATGAGGTG GTGGGTTGTA TACATTAA

Protein sequence

MVKNKLKISK VFYKRNLLFL LPPEVAHSLA IMALKKMPYK NPIELPESLS VNFFGNKLRS 
PVGLAAGFDK NAEVIRPMLS FGFGFIETGT VTRNPQYGNK KPRIFRLIKD QGVINRLGFN 
NKGIDYFLKQ IGETKLDDCI FGINIGKNST SKDQISDYVD LIKIVYGKSN YIVLNISSPN 
TPNLRNLHNK QELSELLKSV TLTRKSIDNS KSIPIILKIS PDVDQQTKEN IAELALEYKI 
DGLTVSNTTV SRDNLHSHHN ESGGLSGKPL FKLSTELLGD MYKFTKGKIL LIGCGGISSG 
ADAYKKIKAG ASLVQLYTAL IYHGPQVVNK INLELAELIR RDGFSNINEV VGCIH