Gene A9601_13341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_13341
Symbol	psbD
ID	4718053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1108626
End bp	1109702
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	40%
IMG OID	640079053
Product	photosystem II PsbD protein (D2)
Protein accession	YP_001009725
Protein GI	123968867
COG category
COG ID
TIGRFAM ID	[TIGR01152] Photosystem II, DII subunit (also called Q(A))

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATCG CAGTTGGTAG CGCCCCACAA AGAGGATGGT TTGATGTCCT TGATGATTGG 
TTGAAGCGCG ACCGCTTTGT ATTTATTGGT TGGTCCGGAC TACTCCTACT TCCTTGTGCA 
TATCTTGCTA TAGGTGGTTG GTTCGTCGGA ACAACATTTG TTACCTCTTG GTACACACAT 
GGAGTTGCAA GCTCATACCT TGAAGGTTGT AACTTTTTAA CAGCAGCTGT AAGTACCCCT 
GGTGATGCCA TGGGACACAG TCTTCTATTT TTATGGGGTC CTGAAGCCCA AGGTAGTTTC 
GTAAGATGGC TACAGCTTGG TGGTCTTTGG AACTTCGTTG CATTACATGG AGTATTTGGC 
CTTATTGGTT TTATGCTTCG TCAGTTTGAA ATTGCTGGCC TTGTTGGAAT TAGACCTTAC 
AACGCTTTAG CATTCTCAGC AGTAATTGCA GTATTTACAA GTATTTTCCT TATTTATCCT 
TTAGGACAGC ATAGTTGGTT CTTCGCACCT TCATTCGGTG TTGCAGCAAT CTTCCGTTAC 
ATTCTGTTCA TTCAAGGTTT TCATAATATT ACTTTAAATC CATTTCACAT GATGGGTGTT 
GCTGGAATTC TTGGTGGTGC TCTACTTTGC GCTATTCATG GAGCTACAGT ACAAAACACT 
TTGTATGAAG ATACAAGTAT TTATACAGAT GGTAAGGTTC AAAGTTCAAC ATTTAGAGCT 
TTTGACCCAA CTCAAGAAGA AGAAACTTAT TCAATGATTA CAGCGAATAG ATTCTGGAGT 
CAAATCTTCG GTATTGCTTT CTCAAACAAG CGTTTCTTAC ATTTCTTGAT GCTATTTGTA 
CCTGTAATGG GTATGTGGAC ATCTTCAATT GGTATCGTCG GCTTAGCACT AAACTTAAGA 
GCTTATGATT TCGTAAGCCA AGAAATTCGT GCAGCAGAAG ATCCAGAATT TGAAACTTTC 
TATACAAAAA ATATACTTTT GAACGAAGGT ATGCGAGCAT GGATGTCTTC TGTGGATCAA 
CCACACGAAA ACTTTGTATT CCCTGAGGAG GTTCTTCCAC GTGGAAACGC CCTTTAA

Protein sequence

MTIAVGSAPQ RGWFDVLDDW LKRDRFVFIG WSGLLLLPCA YLAIGGWFVG TTFVTSWYTH 
GVASSYLEGC NFLTAAVSTP GDAMGHSLLF LWGPEAQGSF VRWLQLGGLW NFVALHGVFG 
LIGFMLRQFE IAGLVGIRPY NALAFSAVIA VFTSIFLIYP LGQHSWFFAP SFGVAAIFRY 
ILFIQGFHNI TLNPFHMMGV AGILGGALLC AIHGATVQNT LYEDTSIYTD GKVQSSTFRA 
FDPTQEEETY SMITANRFWS QIFGIAFSNK RFLHFLMLFV PVMGMWTSSI GIVGLALNLR 
AYDFVSQEIR AAEDPEFETF YTKNILLNEG MRAWMSSVDQ PHENFVFPEE VLPRGNAL