Gene NATL1_02161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02161
Symbol	pds
ID	4779454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	200780
End bp	202168
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	39%
IMG OID	640083481
Product	phytoene desaturase
Protein accession	YP_001014045
Protein GI	124024929
COG category	[S] Function unknown
COG ID	[COG3349] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02731] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTAG CAATCGCTGG AGCCGGATTG GCAGGACTCT CATGTGCAAA ATACTTAGCC 
GATGCTGGTC ATACGCCATT TGTTTATGAA GCAAGAAACG TACTTGGCGG AAAAGTTGCT 
GCTTGGAAAG ATGATGATGG TGACTGGTAT GAGACTGGAT TACATATATT TTTTGGAGCT 
TATCCAAATA TGCTCCAGCT TTTTAAAGAA CTAGATATTG AAGATCGTCT TCAATGGAAA 
AGTCATTCCA TGATTTTCAA CCAACCAGAA GAACCTGGGA CATATAGCCG TTTCGACTTC 
CCTGATCTTC CTGCTCCAAT CAATGGAGTG GCAGCGATTT TAAGCAACAA TGACATGCTT 
AGCTGGCCAG AAAAAATTTC GTTTGGACTG GGACTAGTAC CAGCTATGTT GCGTGGCCAA 
AATTATGTAG AGGATTGTGA TAAGTACTCT TGGACGGAAT GGCTGAAAAA ACAAAATATC 
CCCGAAAGAG TCAATGATGA AGTTTTTATA GCAATGAGTA AGGCACTTAA TTTTATAGGT 
CCTGATGAAA TTTCCTCAAC AGTATTGCTA ACTGCATTAA ACCGCTTCTT ACAAGAAAAA 
AACGGATCAA AAATGGCATT TCTTGATGGA GCTCCACCAG AACGACTTTG TCAACCAATT 
GTTGATCACA TCAGAGCTTT AGGAGGCGAC GTATTTTTAA ATAGCCCACT AAAAAAAATA 
AATTTACAAC AAGATGGATC TGTTGAAAAT TTCTTAATAG GTAGTGCCAA AGAACCTCAG 
GGAAAAGAAA TCCAAGCAGA CGCGTATGTC AGCGCAATGC CCGTTGATAT TTTCAAAACA 
ATTTTGCCCA ATGAATGGGC CTCTCAAGAT ATTTTCAGAA AACTTGAGGG ACTGAAAGGA 
GTCCCAGTTA TTAATATTCA TCTTTGGTTC GATCGAAAAC TTACAAATAT TGATCACCTG 
TTATTCAGCA GATCTCCACT TTTAAGTGTC TATGCCGACA TGAGCATAAC TTGTAAAGAA 
TATGAAGATC CCAATCGATC AATGCTTGAA TTAGTTTTTG CTCCTGCAAA AGACTGGATT 
GGTCGTAAAG ACGAGGAAAT AATTGATGCA ACAATGCAAG AATTGAAGAA ACTTTTTCCC 
ATGCATTTCT CTGGGGAAAA TCAAGCTAAA TTGAGAAAAT ATAAAGTAAT AAAAACACCA 
AAATCAGTCT ACAAAGCTGT TCCTGGATGC CAAGATTTAA GGCCAGACCA AAAGACTCCA 
ATAAGAAACT TTTTCTTAAC TGGTGATTAC ACAATGCAAA AATACCTCGC TTCCATGGAA 
GGTGCAGTCC TAAGTGGAAA AATATGTGCA GAAAAAATCC AAATCTCGAC TGACATAGGT 
TCTTCTTAG

Protein sequence

MRVAIAGAGL AGLSCAKYLA DAGHTPFVYE ARNVLGGKVA AWKDDDGDWY ETGLHIFFGA 
YPNMLQLFKE LDIEDRLQWK SHSMIFNQPE EPGTYSRFDF PDLPAPINGV AAILSNNDML 
SWPEKISFGL GLVPAMLRGQ NYVEDCDKYS WTEWLKKQNI PERVNDEVFI AMSKALNFIG 
PDEISSTVLL TALNRFLQEK NGSKMAFLDG APPERLCQPI VDHIRALGGD VFLNSPLKKI 
NLQQDGSVEN FLIGSAKEPQ GKEIQADAYV SAMPVDIFKT ILPNEWASQD IFRKLEGLKG 
VPVINIHLWF DRKLTNIDHL LFSRSPLLSV YADMSITCKE YEDPNRSMLE LVFAPAKDWI 
GRKDEEIIDA TMQELKKLFP MHFSGENQAK LRKYKVIKTP KSVYKAVPGC QDLRPDQKTP 
IRNFFLTGDY TMQKYLASME GAVLSGKICA EKIQISTDIG SS