Gene P9301_02191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_02191
Symbol	pyrD
ID	4911905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	203894
End bp	205063
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	31%
IMG OID	640159785
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001090443
Protein GI	126695557
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAC AGCAGGGGGT ATTTAAAAAT CTTTATAAAA ACTTGATGAC ACCTATACTA 
AAAAATGATT CTGGAATAGA TGCAGAATAT TTAACTAATT TATCTCTTAG CCTTCTATCA 
TTTAGTTCAA GAAAATATAA TTGGCCTTTA GTTTCATCAA TCCTAAAAAA TTTAAATGAA 
GAATTTTCTG TAATTGATAA AAGGTTAAGT CAAAACATAT GTGGAATAAA TTTTTGTAAT 
CCAATTGGTT TAGCTGCAGG TTTTGACAAA AATGGGAATG CTGCAAATAT ATGGAAAGAT 
TTTGGTTTTG GATTTGCAGA ACTTGGAACA GTAACTAAAT TTGCTCAAAA TGGCAATCCA 
AAACCAAGGT TATTTAGATT AGCTGAAGAA GAAGCAGCAT TAAATAGGAT GGGTTTCAAT 
AATAATGGTG CTGAAAATCT GGTTAAAAAT TTTCTTGAGC AGGGTATCGA GTTCAAAAAA 
AATAGGGATA ATATTTGTTT AGGGATAAAT TTCGGTAAGT CTAAAATCAC AAGCTTATCT 
CAAGCAAAAG ATGATTATTT AACTTCTCTA GAATTATTAA TTCCATATTG TGATTACGCA 
GCAATAAACG TAAGTTCTCC AAATACTGAA GGACTAAGAA AGTTGCAAGA TCCAATACTT 
CTAAAAGACC TTCTTAGAGC AATTAAAAAC TTACCTAATT GTCCACCATT ATTTGTAAAA 
ATTGCGCCAG ATTTAAGCCT TAAAGATATT GAAGATATTT GCAAGTTAAT AATCGAGGAA 
AATATAGATG GGATAATTGC TACTAACACC AGCATAGATA GATTAGGTCT TGAAAATAGG 
AAGATAAGGC AAACAGGATT ATTACTTTCT GAAGAAAATG GAGGCTTAAG TGGAAAACCT 
TTACAAAAAA AAGCAAATCA AGTCATAAAA GATATTCGTA ATATTGATAA AAATATTATT 
TTAATTGGCG TTGGTGGAAT CGATAGTCCT GAGTCGGCTT GGGAAAGAAT TTGTTCTGGA 
GCATCATTAA TTCAACTTTA TACGGGATGG ATATATAAGG GGCCACAATT AGTCCCCAAT 
ATACTTGAAG GAATTTTAAA GCAACTCAAT ATCCATCAAT TGTCCAATAT TAAAGAGGCC 
ATTGGATCAG ATTTAAAATG GGTTAAATAA

Protein sequence

MNEQQGVFKN LYKNLMTPIL KNDSGIDAEY LTNLSLSLLS FSSRKYNWPL VSSILKNLNE 
EFSVIDKRLS QNICGINFCN PIGLAAGFDK NGNAANIWKD FGFGFAELGT VTKFAQNGNP 
KPRLFRLAEE EAALNRMGFN NNGAENLVKN FLEQGIEFKK NRDNICLGIN FGKSKITSLS 
QAKDDYLTSL ELLIPYCDYA AINVSSPNTE GLRKLQDPIL LKDLLRAIKN LPNCPPLFVK 
IAPDLSLKDI EDICKLIIEE NIDGIIATNT SIDRLGLENR KIRQTGLLLS EENGGLSGKP 
LQKKANQVIK DIRNIDKNII LIGVGGIDSP ESAWERICSG ASLIQLYTGW IYKGPQLVPN 
ILEGILKQLN IHQLSNIKEA IGSDLKWVK