Gene P9301_03401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_03401
Symbol	psbB
ID	4912483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	310621
End bp	312144
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	42%
IMG OID	640159910
Product	photosystem II PsbB protein (CP47)
Protein accession	YP_001090564
Protein GI	126695678
COG category
COG ID
TIGRFAM ID	[TIGR03039] photosystem II chlorophyll-binding protein CP47

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTGC CTTGGTATCG AGTTCACACA GTAGTTATTA ATGACCCAGG TCGACTACTT 
GCTGTGCATC TTATGCATAC TGCATTATTA GCCGGCTGGG CCGGTTCAAT GGCTCTTTAC 
GAATTAGCCA TTTTTGATCC TTCTGATGCT GTTCTCAATC CAATGTGGAG ACAGGGGATG 
TACGTTATGC CTTTTATGGC AAGACTAGGT ATCACAAGTA GTTGGAACGG ATGGGATATT 
ACCGGTGCTA CTGGAGTTGA TCCTGGATTC TGGAGTTTCG AAGGGGTTGC CGCAGCTCAC 
ATAGTATTTA GTGGTCTATT AATGTTGGCC TCTATTTGGC ACTGGACATA CTGGGACTTA 
GATTTGTGGG AAGATTCAAG AACTGGTGAA CCTGCTCTTG ACTTGCCAAG AATTTTCGGG 
ATTCACCTCC TTCTAGCAGG ACTAACCTGT TTTGGTTTTG GAGCTTTTCA TTGTGCAAAC 
GTTGGGATTT GGGTTTCTGA CCCTTATGGC TTAACTGGTC ACGTAGAACC TGTGGCTCCA 
TCCTGGGGAG TAGAAGGATT TAATCCTTTT AATCCTGGAG GTATAGTGGC GAACCATATT 
GCAGCAGGAC TTATGGGTAT TATTGGAGGT ATTTTTCATA TCACCAATAG ACCTGGAGAA 
AGACTTTATA GAGCACTAAA ACTTGGAAGT CTCGAGGGAG TTCTAGCTAG TGCTTTGGCT 
GCTGTATTAT TTGTTTCTTT CGTTGTTTCC GGAACAATGT GGTACGGTTC AGCAACAACT 
CCGGTAGAGC TTTTTGGTCC TACCAGATAT CAATGGGATT CAGGCTATTT CAAAACTGAA 
ATCAATAGAA GAGTGCAAGC TGCTATAGAT GATGGTGCCA CTAAATCAGA GGCATATGCA 
TCGATTCCAG AAAAATTAGC CTTCTACGAT TACGTTGGAA ATAGTCCAGC TAAAGGAGGA 
CTATTTAGAG TTGGAGCTCT TGTTAATGGT GATGGATTAC CAACTGGTTG GCAAGGTCAC 
ATTGCTTTTC AAGATAAGGA AGGTAACGAA TTAGAAGTTA GAAGAATTCC TAATTTCTTT 
GAAAACTTCC CTGTCATTCT TGAAGACAAA GAAGGTAATG TAAGAGCAGA TATCCCATTT 
AGAAGAGCTG AAGCAAAGTA TTCATTCGAA CAGACTGGTA TAACTGCAAC TATCTATGGA 
GGAGACCTAG ATGGACAAAC ATTTACAGAC CCTGCAGTAG TTAAAAGGTT AGCTAGAAAA 
GCTCAACTTG GAGAAGCATT CAAGTTTGAC AGAGAAACAT ATAAATCTGA TGGCGTATTC 
CGAAGTTCTC CAAGAGCCTG GTTTACATAT GCACATTTAT GTTTCGGATT GCTATTCTTA 
TTTGGTCACT GGTGGCATGC TTCAAGAACT CTTTACAGAA ATTCCTTTGC TGGTATTGAT 
GCTGAGATTG GAGACCAAGT TGAATTTGGT TTATTCAAGA AACTTGGTGA CGAAACCACA 
AGAAGAATCC CAGGAAGGGT TTAA

Protein sequence

MGLPWYRVHT VVINDPGRLL AVHLMHTALL AGWAGSMALY ELAIFDPSDA VLNPMWRQGM 
YVMPFMARLG ITSSWNGWDI TGATGVDPGF WSFEGVAAAH IVFSGLLMLA SIWHWTYWDL 
DLWEDSRTGE PALDLPRIFG IHLLLAGLTC FGFGAFHCAN VGIWVSDPYG LTGHVEPVAP 
SWGVEGFNPF NPGGIVANHI AAGLMGIIGG IFHITNRPGE RLYRALKLGS LEGVLASALA 
AVLFVSFVVS GTMWYGSATT PVELFGPTRY QWDSGYFKTE INRRVQAAID DGATKSEAYA 
SIPEKLAFYD YVGNSPAKGG LFRVGALVNG DGLPTGWQGH IAFQDKEGNE LEVRRIPNFF 
ENFPVILEDK EGNVRADIPF RRAEAKYSFE QTGITATIYG GDLDGQTFTD PAVVKRLARK 
AQLGEAFKFD RETYKSDGVF RSSPRAWFTY AHLCFGLLFL FGHWWHASRT LYRNSFAGID 
AEIGDQVEFG LFKKLGDETT RRIPGRV