Gene NATL1_02751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02751
Symbol	pyrD
ID	4779941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	255182
End bp	256339
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	36%
IMG OID	640083540
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001014104
Protein GI	124024988
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCAACAA CTAAAAAAAA CGACTTATAC AACATTCTCC TCGGTCAGCT TCTATCTCAA 
GACGAGGGTA TTGATGCAGA AATACTTACT AATTCAGCCC TTAATGCAAT TAAATTCGCA 
TCATTAAATA GAAACTTTCC ATTAATTTCT AATATCCTTT TAAAAGCATC AAATGATTTT 
CAAAGAAACA ATTCAAGCTT AAATCAAATT GTTTTTGGCT CTCACTTTAA AAATCCTGTG 
GGACTTGCTG CTGGATTTGA CAAGAATGGC GTAGGAGCAG GTCTTTGGAA TTATTTTGGA 
TTTGGTTTCG CCGAATTGGG AACTATTACT TGGCATGCCC AAGAAGGCAA TCCAAAGCCT 
AGACTTTTCA GAATTGCAAA AGAGAAAGCT GCGCTGAATC GAATGGGATT CAATAACCAA 
GGAGCAGAAA ATTTTTTGAA AACAATCGAA AAACAGAAAA TCCTTGCACC AGGGAATAGA 
CCTTGTGTCC TAGGAATAAA TTTAGGCAAG TCAAAAATCA CTCCACTCGA TGAAGCCCAT 
ATAGACTATT CTTTATCTCT AAAACTACTG GCTCCTTTAT CAGACTATGC AGTAATTAAT 
GTTAGTTCAC CTAATACCCC AGGCCTTCGT TCATTACAAG GAACAAAACA AATAAAAAAA 
TTAATAATCA CGCTTAAAGA TTTACCCAAT TGTCCTCCTT TGCTTGTAAA AATTGCCCCA 
GATCTTTCCA ATGAAGCAAT TGATGAAATT GCAAGAGTTG CGATGGAAAA TGGCATCGAT 
GGAATTATTG CAATCAATAC AAGCTTAGAT AGATTTGATT TAAAAAATCT GAAAATCAAA 
ACTGGAAATA CTCTAGGACA AGAAAATGGA GGATTAAGTG GTCTACCCTT ACAAAAAAGA 
GGACTAGAAG TTATTCGGAG ACTAAGAAGA AGTACTGATA ATGATTTACC TCTGATTGGT 
GTGGGTGGAA TTCATTCAGC AAGAGCGGCA TGGGAAAGAA TTACAGCTGG TGCCTCACTG 
GTTCAGATTT ATACTGGGTG GATATTTGAG GGACCAAATT TAGTTCCAGA CATACTAGAT 
GGATTAATCC AGCAAATGGA AAAACATGGA TTCCGAAATA TTAAAGAGGC CATAGGTTCC 
GAAGAACCAT GGAAGTAA

Protein sequence

MPTTKKNDLY NILLGQLLSQ DEGIDAEILT NSALNAIKFA SLNRNFPLIS NILLKASNDF 
QRNNSSLNQI VFGSHFKNPV GLAAGFDKNG VGAGLWNYFG FGFAELGTIT WHAQEGNPKP 
RLFRIAKEKA ALNRMGFNNQ GAENFLKTIE KQKILAPGNR PCVLGINLGK SKITPLDEAH 
IDYSLSLKLL APLSDYAVIN VSSPNTPGLR SLQGTKQIKK LIITLKDLPN CPPLLVKIAP 
DLSNEAIDEI ARVAMENGID GIIAINTSLD RFDLKNLKIK TGNTLGQENG GLSGLPLQKR 
GLEVIRRLRR STDNDLPLIG VGGIHSARAA WERITAGASL VQIYTGWIFE GPNLVPDILD 
GLIQQMEKHG FRNIKEAIGS EEPWK