Gene P9211_02171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_02171
Symbol	pyrD
ID	5731446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	209632
End bp	210810
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	42%
IMG OID	641284561
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001550102
Protein GI	159902758
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.894621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACATC CATCAGAGTC TAAATTTCTG TCAATCAAAT CCGTATATCA ACGATTCCTT 
TCGCCAATCC TTTCAGAAGA TGAAGGGATT GATGCCGAAC AACTAACAAA CTTTGCACTC 
AATACGCTTG GACAAGTCTC CATTTATAGA CAATGGCCAG GCTTTTCCGG GTTATTAGCT 
CAAGTAGGCA AAGAACTTCA AAGGAGTGAC CCAAGATTAA CGCAAAAGTT ATTTGGTTGT 
AATTTTGATA ACCCTATAGG CCTAGCAGCA GGTTTTGATA AGAATGCTAT TGCAGCGGGT 
ATTTGGCATT ATTTTGGTTT TGGGTTTGCA GAACTCGGCA CCGTCACTTG GCATCCTCAG 
CAAGGGAATC CAAAACCACG TTTGTTCCGG CTAGCAAAGG AACAAGCAGC TTTAAATCGC 
ATGGGTTTTA ACAATAACGG CGCCATTATC ATGCGAAGTA CATTAGAAAA GCAAAAGATT 
TCTGCTCGAG GGCAAAGACC TGCAGTACTT GGAATCAACT TTGGAAAGTC GAAAATCTGC 
TCACTAGAGC AAGCAGCCGA TGACTATGCT GCATCTCTTG AATTACTAGC TCCCTTGGCC 
GATTATGCTG TCATAAATGT CAGCTCTCCT AATACCCCAG GTCTAAGGAA GTTACAAGAC 
CCGAAACAAT TACGACGCTT AATCGAACGT CTACGACGAC TACGTAGTTG TCCACCATTA 
CTTGTAAAAA TTTCACCGGA TCTAGAAGAC CATGCAATTA GTGACTTAGC AAAGCTAGCT 
TACGAAGAAG GTTTAGCAGG GATAATTGCT ATCAATACTA GTGTTGATAG ATTAGGATTA 
GGAAATAGAG TTATTTCACA AACTGGATTA ACTCTAGGAA ATGAAGTCGG TGGTTTGAGT 
GGGGCTCCAC TAAACAAAAG AGCCATAGAG GTTATAAAAC TACTTCGAGA GTCAGCTGGT 
GAAAACCTAC CACTTATAGG AGTTGGTGGT ATCAACTCTC CACAACATGC TTGGGAACGT 
ATTAGTGCCG GTGCTACTCT TCTTCAGATA TATACAGGCT GGATTTTTCA AGGGCCGACA 
CTGGTACCTT TAATTTTAGA TGGATTGTCG AGCCAACTAG ATCAGCATGG GTTTCGAAAT 
ATCACTGAAG CTATAGGGAG TAATGCACCA TGGATATAG

Protein sequence

MAHPSESKFL SIKSVYQRFL SPILSEDEGI DAEQLTNFAL NTLGQVSIYR QWPGFSGLLA 
QVGKELQRSD PRLTQKLFGC NFDNPIGLAA GFDKNAIAAG IWHYFGFGFA ELGTVTWHPQ 
QGNPKPRLFR LAKEQAALNR MGFNNNGAII MRSTLEKQKI SARGQRPAVL GINFGKSKIC 
SLEQAADDYA ASLELLAPLA DYAVINVSSP NTPGLRKLQD PKQLRRLIER LRRLRSCPPL 
LVKISPDLED HAISDLAKLA YEEGLAGIIA INTSVDRLGL GNRVISQTGL TLGNEVGGLS 
GAPLNKRAIE VIKLLRESAG ENLPLIGVGG INSPQHAWER ISAGATLLQI YTGWIFQGPT 
LVPLILDGLS SQLDQHGFRN ITEAIGSNAP WI