Gene P9515_03471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9515_03471
Symbol	psbB
ID	4718706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9515
Kingdom	Bacteria
Replicon accession	NC_008817
Strand	-
Start bp	320428
End bp	321951
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	42%
IMG OID	640080014
Product	photosystem II PsbB protein (CP47)
Protein accession	YP_001010663
Protein GI	123965582
COG category
COG ID
TIGRFAM ID	[TIGR03039] photosystem II chlorophyll-binding protein CP47

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTGC CTTGGTATCG AGTTCACACA GTAGTTATCA ACGACCCCGG TCGACTACTA 
GCTGTGCATC TCATGCATAC TGCATTATTA GCCGGCTGGG CCGGCTCAAT GGCTCTATAT 
GAATTAGCCA TTTTTGATCC TTCAGACGCT GTTCTCAATC CAATGTGGAG ACAGGGGATG 
TATGTCATGC CATTCATGGC AAGATTAGGA ATCACTAGTA GTTGGAACGG ATGGGATATT 
ACTGGTGCTA CAGGAGTTGA CCCAGGATTC TGGAGCTTTG AAGGTGTTGC TGCAGCCCAC 
ATCGTTTTTA GTGGACTGCT AATGCTTGCT TCGATCTGGC ATTGGACATA TTGGGATTTA 
GATCTATGGG AAGACGAAAG AACAGGAGAA CCTGCTCTTG ATCTTCCTAG AATATTTGGT 
ATTCACCTTC TTTTAGCTGG AATTACTTGT TTTGGATTTG GAGCTTTTCA CTGTGCAAAT 
GTAGGCATTT GGGTTTCTGA CCCATATGGT TTAACAGGTC ATGTAGAACC CGTTGCACCA 
TCATGGGGAG CCGATGGATT TAATCCGTTC AATCCTGGTG GTATAGTTGC AAATCACATT 
GCAGCCGGGC TTCTTGGAAT TATAGGTGGA ATTTTCCATA TTACTAATAG ACCAGGTGAG 
AGGCTCTACA AAGCATTAAG GTTAGGAAGC TTAGAGGGTG TTTTAGCAAG CGCTTTAGCT 
GCTGTTCTTT TTGTATCTTT TGTTGTCGCT GGAACAATGT GGTATGGATC TGCAACAACG 
CCTGTAGAAT TATTTGGCCC TACAAGATAC CAATGGGACT CTGGTTACTT CAAAACTGAA 
ATTAATAGAA GAGTACAAGC AGCTATTGAT GACGGAGCGA CTAGGGAAGA AGCATATGCT 
GCAATTCCTG AAAAGTTAGC TTTCTACGAC TATGTAGGAA ATAGTCCTGC AAAAGGAGGA 
TTGTTTAGGG TTGGAGCTCT TGTAAATGGA GATGGATTAC CCACAGGATG GCAGGGGCAT 
ACTGTATTCA CAGATAAAGA AGGCAATGAC TTAGAAGTCA GAAGAATTCC TAATTTCTTT 
GAAAACTTCC CCGTTATTCT CGAAGATAAA CAGGGTAATG TAAGAGCTGA TATCCCATTT 
AGAAGAGCTG AAGCAAAGTA TTCTTTTGAA CAAACTGGCA TCACAGCTAC AATTTATGGT 
GGTGATCTTA ATGGTCAAAC ATTTACAGAC CCAGCTGTGG TTAAAAGACT AGCCCGTAAA 
GCTCAGTTAG GAGAGGCATT CAAGTTTGAT AGAGAAACCT ATAAATCTGA TGGTGTTTTC 
CGTAGTTCTC CAAGAGCTTG GTTTACATAT GCACATTTAT GTTTCGGATT ACTATTCCTA 
TTTGGACACT GGTGGCACGC CTCTAGAACC CTCTATAAAG ATAGATTCGC TGGTATTGAC 
GCTGAGATAG GAGATCAAGT TGAGTTTGGT CTCTTTAAGA AACTTGGTGA CGAAACCACC 
AGAAGAATCC CAGGAAGGGT TTAA

Protein sequence

MGLPWYRVHT VVINDPGRLL AVHLMHTALL AGWAGSMALY ELAIFDPSDA VLNPMWRQGM 
YVMPFMARLG ITSSWNGWDI TGATGVDPGF WSFEGVAAAH IVFSGLLMLA SIWHWTYWDL 
DLWEDERTGE PALDLPRIFG IHLLLAGITC FGFGAFHCAN VGIWVSDPYG LTGHVEPVAP 
SWGADGFNPF NPGGIVANHI AAGLLGIIGG IFHITNRPGE RLYKALRLGS LEGVLASALA 
AVLFVSFVVA GTMWYGSATT PVELFGPTRY QWDSGYFKTE INRRVQAAID DGATREEAYA 
AIPEKLAFYD YVGNSPAKGG LFRVGALVNG DGLPTGWQGH TVFTDKEGND LEVRRIPNFF 
ENFPVILEDK QGNVRADIPF RRAEAKYSFE QTGITATIYG GDLNGQTFTD PAVVKRLARK 
AQLGEAFKFD RETYKSDGVF RSSPRAWFTY AHLCFGLLFL FGHWWHASRT LYKDRFAGID 
AEIGDQVEFG LFKKLGDETT RRIPGRV