Gene A9601_17731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_17731
Symbol
ID	4718506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1505093
End bp	1506598
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	33%
IMG OID	640079502
Product	phytoene dehydrogenase
Protein accession	YP_001010163
Protein GI	123969305
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02733] C-3',4' desaturase CrtD

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAATT CTGAAGTTAT TGTTATTGGC GCCGGTATAG CAGGACTAAC TTCTGCAGCG 
ATTTTATCAA AACAAGGCTT ATCAGTGACC TTAATCGAAT CTCATACTCA AGCCGGAGGA 
TGTGCCGGTA CTTTTAAAAG AAAGAATTAT ACTTTCGATG TTGGCGCAAC TCAGGTTGCA 
GGTTTAGAGA AGGGAGGAAT ACATTATAGA ATTTTTGATT TTTTAGATAT TCCATCTCCA 
GAAGCCACAA TTTTAGACCC TGCTTGCATT GTTGATTTAA ATGATGGTGG TAATCCTATA 
CCTATTTGGT ATGAAAAAAG TAAATGGATT GTTGAACGAG AAATGCAGTT TCCTGGGAGT 
CAAAGATTTT GGAAACTTTG TTCCCTAATA CATGAAAGTA ATTGGATATT TGCTAATAAC 
AATCCTGTAT TACCAATAAG CAATTTTTGG GATTTTTCTC AACTTCTTAA AGCACTAGTT 
CCTTCAAACC TTGTCACAGG TATCTTACTT AAATCTACTA TTTTTGATCT ATTGCGGATA 
TGTGGATTAT CCAAGAATGA GCGCTTGATT AAATTCTTAA ATCTTCAACT AAAACTTTAT 
TCTCAAGAGG ATGTTTATAA TACTGCTGCA TTATATGGAT CTACTGTTCT TCAGATGTGT 
CAACAGCCAT ATGGTCTGTG GCATCTTAAA AAATCTATGC AGTCTTTAAG TGAATCATTA 
GAAAGTTCAT TGATTAAAAC TGGAGTTAAT TTATTTTTTG GACAAGAAGT AAATTCTATA 
ACTTTTGACG ACGTAAATAT GTGTTGGCAA GTATCTGCTA ATTCGAAAAA AAAATCATTT 
ATTTACCAAG CAAAAGATGT GATTTATACT GCCCCTCCAC AGTCTTTGCT CAAGCATTTG 
AAAGATCCTT TAGAAAGAAA AAAAAATTAT AAAAATCGAC TTAATAATTT GCCTAATCCA 
AGTGGAGCTG TAGTTTTTTA TTCAGCCTTA AAAAAGGAAC ATATTAAAAA AACATTCTCC 
AATCATTATC AATTTGTTTC GAAAGAATTT TGTTCCTTAT TTGTATCAAT TAGTGATGAT 
GGTGATGGAA GAGCGCCAAA AGGTGAAGTT ACTTTAATTG CCAGTATCTT TACCAAAACT 
AAAGATTGGG TTGACCTAGA TAAACAAACT TATTTAAAGA AGAAAAATAG TTTCATGAAA 
AAAATATCCC TTGAATTGGA AAGTCAATTT GATATTGATC CTGATAAATG GCTACATAGG 
GAATTAGCAA CTCCATTGGG CTTTGAAAGA TGGACAAAAA GACCTAATGG AATAGTAGGG 
GGGCTTGGTC AAAATCCAGA TATTTTTGGT TTATTTGGAT TATCAAGTAG GACACCTTTT 
GAAGGTTTAT GGTTATGTGG AGATTCGATT TATCCAGGAG AGGGGACTGC AGGTGTTAGT 
CAGTCTGCAT TAATGGTTTC AAGGCAAATT TTAGCTTCCA AAGGTGTAAA AAATTTTAGT 
TTATAA

Protein sequence

MRNSEVIVIG AGIAGLTSAA ILSKQGLSVT LIESHTQAGG CAGTFKRKNY TFDVGATQVA 
GLEKGGIHYR IFDFLDIPSP EATILDPACI VDLNDGGNPI PIWYEKSKWI VEREMQFPGS 
QRFWKLCSLI HESNWIFANN NPVLPISNFW DFSQLLKALV PSNLVTGILL KSTIFDLLRI 
CGLSKNERLI KFLNLQLKLY SQEDVYNTAA LYGSTVLQMC QQPYGLWHLK KSMQSLSESL 
ESSLIKTGVN LFFGQEVNSI TFDDVNMCWQ VSANSKKKSF IYQAKDVIYT APPQSLLKHL 
KDPLERKKNY KNRLNNLPNP SGAVVFYSAL KKEHIKKTFS NHYQFVSKEF CSLFVSISDD 
GDGRAPKGEV TLIASIFTKT KDWVDLDKQT YLKKKNSFMK KISLELESQF DIDPDKWLHR 
ELATPLGFER WTKRPNGIVG GLGQNPDIFG LFGLSSRTPF EGLWLCGDSI YPGEGTAGVS 
QSALMVSRQI LASKGVKNFS L