Gene P9301_13491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_13491
Symbol	psbD
ID	4912435
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	1126362
End bp	1127438
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	41%
IMG OID	640160938
Product	photosystem II PsbD protein (D2)
Protein accession	YP_001091573
Protein GI	126696687
COG category
COG ID
TIGRFAM ID	[TIGR01152] Photosystem II, DII subunit (also called Q(A))

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATCG CAGTTGGTAG CGCCCCACAA AGAGGATGGT TTGATGTCCT CGATGATTGG 
TTGAAGCGCG ACCGCTTTGT ATTTATTGGT TGGTCCGGAC TACTTCTACT TCCTTGTGCA 
TACCTTGCTA TAGGTGGTTG GTTTGTCGGA ACAACATTTG TTACCTCTTG GTACACACAC 
GGAGTTGCAA GTTCATACCT TGAAGGTTGT AACTTCTTAA CAGCAGCTGT AAGCACCCCT 
GGTGATGCCA TGGGACACAG TCTTCTATTT TTATGGGGTC CTGAAGCCCA AGGTAGTTTC 
GTAAGATGGC TACAACTTGG TGGTCTTTGG AACTTCGTTG CATTACATGG AGTATTTGGC 
CTAATTGGTT TTATGCTTCG TCAGTTTGAA ATTGCTGGCC TTGTTGGAAT TAGACCATAC 
AACGCACTAG CTTTCTCAGC AGTAATTGCA GTATTCACAA GTATTTTCCT TATTTATCCT 
TTAGGACAGC ATAGTTGGTT CTTCGCACCT TCATTCGGTG TTGCAGCAAT CTTCCGTTAC 
ATCCTATTCA TTCAAGGTTT TCACAATATC ACTTTAAACC CATTCCATAT GATGGGAGTT 
GCTGGAATTC TTGGTGGTGC TCTACTTTGC GCTATTCATG GAGCTACAGT TCAAAATACT 
TTGTATGAAG ATACAAGTAT TTACACAGAT GGTAAGGTTC AAAGTTCAAC ATTTAGAGCT 
TTTGATCCAA CTCAAGAAGA AGAAACCTAT TCAATGATTA CAGCGAATAG ATTTTGGAGT 
CAAATCTTCG GTATTGCTTT CTCAAACAAG CGTTTCTTAC ATTTCTTGAT GCTATTTGTA 
CCTGTTATGG GTATGTGGAC ATCTTCTATT GGTATTGTCG GCTTAGCACT AAACTTGAGA 
GCTTATGACT TCGTAAGCCA AGAAATTCGT GCAGCAGAAG ATCCAGAATT TGAAACTTTC 
TATACAAAAA ATATACTTTT GAACGAAGGT ATGCGAGCAT GGATGTCTTC TGTGGATCAA 
CCACACGAAA ACTTTGTATT CCCTGAGGAG GTTCTTCCAC GTGGAAACGC CCTTTAA

Protein sequence

MTIAVGSAPQ RGWFDVLDDW LKRDRFVFIG WSGLLLLPCA YLAIGGWFVG TTFVTSWYTH 
GVASSYLEGC NFLTAAVSTP GDAMGHSLLF LWGPEAQGSF VRWLQLGGLW NFVALHGVFG 
LIGFMLRQFE IAGLVGIRPY NALAFSAVIA VFTSIFLIYP LGQHSWFFAP SFGVAAIFRY 
ILFIQGFHNI TLNPFHMMGV AGILGGALLC AIHGATVQNT LYEDTSIYTD GKVQSSTFRA 
FDPTQEEETY SMITANRFWS QIFGIAFSNK RFLHFLMLFV PVMGMWTSSI GIVGLALNLR 
AYDFVSQEIR AAEDPEFETF YTKNILLNEG MRAWMSSVDQ PHENFVFPEE VLPRGNAL