Gene P9303_23481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_23481
Symbol	psaA
ID	4778139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2064425
End bp	2066755
Gene Length	2331 bp
Protein Length	776 aa
Translation table	11
GC content	53%
IMG OID	640087869
Product	photosystem I P700 chlorophyll a apoprotein A1
Protein accession	YP_001018348
Protein GI	124024041
COG category
COG ID
TIGRFAM ID	[TIGR01335] photosystem I core protein PsaA

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.735278
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTA GCCCACCAGA GCGTGGGGAA AAAGCGAAGC CTATTTACGA TCAACCAGTC 
GACCGGGACC ACGTTCCAGC CGACTTCGAA AAATTCGAAC AACCCGGATT TTTCTCGAAA 
AGCCTCGCTA AGGGACCAAA CTCCACAACC TGGATTTGGA ACCTCCACGC TGACGCCCAC 
GACTTCGATA CCCACATTGG GGATCTGGAA GAAACCAGCC GGAAGATCTT TTCGGCGCAC 
TTCGGCCATT TGGCCATAGT GTTTATTTGG TTAAGCGGTG CCTTCTTCCA CGGTGCCCGC 
TTCTCCAACT ACTCCGGCTG GCTAGCCGAC CCCACGCACG TGAAAGCCAG TGCGCAGGTC 
GTTTGGCCAA TTGTCGGTCA AGAAATCATG AATGCAGATG TGGGTGCCGG CTTTAACGGC 
ATCCAGATCA CCTCCGGCAT TTTCCAAATG TGGAGGGCTT GGGGAATTAC CAGTGAGACA 
GAGCTCATGG CTCTTGCAAC TGGTGCCCTA ATCATGGCTG GCCTTGTTCT CCATGGCGGA 
ATCTTCCACT ACCACAAAGC AGCTCCAAAG CTCGAGTGGT TTAAGAAGAT TGAGTCGATG 
CTTCAGCACC ATCAGATTGG TCTGTTTGGC TTGGGCTCTC TTGGTTGGAC AGGTCACTTG 
ATCCATGTGG CCAACCCCAC CAACGCCCTA TTGGATGCCA TAGATGCAGG CACTCCAATG 
GTGCTTGATG GCAAGACCAT TGCCACTGCA GCGGATATCC CTCTGCCCCA CGAGCTCTAC 
AACGCTGATC TCGTTGGCCA GATTTATCCA GGTCTTGCTT CAGGCATCGG GAATTTCTTC 
TCGGCTAATT GGTGGGCCTT TAGTGATTTT CTCACCAACA ACGGAGGAGT GAATCCTGTA 
ACAGGTGCTC TATGGAGTAC TGATGTTGCT CATCACCATT TGGCATGGGC GGTCTTTTTG 
ATGTTTGGTG GCCACGTATA CCGCTCAAGA TTCGGTATCG GCCACAGCAT GAAAGAGATC 
ATGGGGAACG TAAAGGGTGA CCCCCTCTTA TTCCCAGCTC CCAATGGTCA TAAAGGTCTC 
TTCGAGTTCC TTTCCAACAG CTGGCATGCT CAGCTGGCAG TAAACCTGGC ATGCATTGGT 
TCAGGGAGCA TCGTGGTTGC ACACCACATG TATTCTCTAC CTCCATATCC ATACCTTGCG 
ACTGATTACC CAACGGTTCT TGGGCTATTC ACACACCACA TGTGGATTGG TGGTTTGATG 
ATTTGCGGAG CAGCAGCTCA CGCTGGCATC GCAGTCATTC GTGACTATGA CGTCTCAGTT 
CACGTCGATA ACGTGCTTGA TCGCATGTTC AAGGCGCGCG ATGCAATCAT CAGTCACCTC 
AACTGGGTGT GTATGTTCCT TGGCTTCCAC AGCTTCGGAC TTTATATACA CAACGACAGC 
ATGCGTGCTT TGGGTCGTTC CCAAGACATG TTCAGCGACT CTGCAATCCA GTTGCAGCCT 
GTCTTGGCTC AATGGATTCA AAGCCTTTGG GCGTCTTCAA TTGGCACATC ATCTGTGGTT 
GGCACGACAA CAGGTCTGCC AGGTGCAGTG AGTGATGTAT TCAACGGAGG CGTTGTAGCA 
GTTGGCGGCA AGGTGGCTCT GATGGCTATT CCCTTGGGAA CAGCCGACTT GATGATTCAC 
CACATCCATG CCTTCACCAT TCACGTAACT TGCCTCATCC TTCTTAAGGG TGTGCTTTTT 
GCCCGCAGTT CCCGTCTTGT TCCTGACAAG GCGAATCTTG GCTTCCGCTT CTCTTGCGAT 
GGCCCAGGTC GTGGTGGTAC CTGCCAGGTT TCCTCTTGGG ACCACGTGTT CCTAGGCCTG 
TTCTGGATGT ACAACTCCCT ATCGATGGTG ATCTTCTACT TCTCGTGGAA GATGCAAAGC 
GATGTATGGG GCACTGTCAA TTCAGACGGG AGTGTGACTC ATCTCGTTTC TGGCAACTTT 
GCTCAAAGCG CCATCACTGT GAATGGTTGG TTCCGTGACT TCCTATGGGC TCAGTCCTCA 
CAGGTGCTCA CGAGCTACGG CACTGGCCTA AGCGGCTATG GCCTGTTATT CCTTGGTGGC 
CACTTCGTGT GGGCCTTTAG CTTGATGTTC TTGTTCAGCG GCCGTGGCTA CTGGCAGGAG 
CTATTTGAAT CCATTATCTG GGCTCATAAC AAGCTCAAGC TTGCTCCCAC CATCCAGCCC 
CGGGCACTTT CGATTACGCA GGGCCGCGCA GTTGGTGTAA CCCACTTCCT GTTTGGTGGC 
ATTGTGACCA CCTGGGCCTT CTTCCATGCC CGCCTTCTTG GGCTCGGCTG A

Protein sequence

MTISPPERGE KAKPIYDQPV DRDHVPADFE KFEQPGFFSK SLAKGPNSTT WIWNLHADAH 
DFDTHIGDLE ETSRKIFSAH FGHLAIVFIW LSGAFFHGAR FSNYSGWLAD PTHVKASAQV 
VWPIVGQEIM NADVGAGFNG IQITSGIFQM WRAWGITSET ELMALATGAL IMAGLVLHGG 
IFHYHKAAPK LEWFKKIESM LQHHQIGLFG LGSLGWTGHL IHVANPTNAL LDAIDAGTPM 
VLDGKTIATA ADIPLPHELY NADLVGQIYP GLASGIGNFF SANWWAFSDF LTNNGGVNPV 
TGALWSTDVA HHHLAWAVFL MFGGHVYRSR FGIGHSMKEI MGNVKGDPLL FPAPNGHKGL 
FEFLSNSWHA QLAVNLACIG SGSIVVAHHM YSLPPYPYLA TDYPTVLGLF THHMWIGGLM 
ICGAAAHAGI AVIRDYDVSV HVDNVLDRMF KARDAIISHL NWVCMFLGFH SFGLYIHNDS 
MRALGRSQDM FSDSAIQLQP VLAQWIQSLW ASSIGTSSVV GTTTGLPGAV SDVFNGGVVA 
VGGKVALMAI PLGTADLMIH HIHAFTIHVT CLILLKGVLF ARSSRLVPDK ANLGFRFSCD 
GPGRGGTCQV SSWDHVFLGL FWMYNSLSMV IFYFSWKMQS DVWGTVNSDG SVTHLVSGNF 
AQSAITVNGW FRDFLWAQSS QVLTSYGTGL SGYGLLFLGG HFVWAFSLMF LFSGRGYWQE 
LFESIIWAHN KLKLAPTIQP RALSITQGRA VGVTHFLFGG IVTTWAFFHA RLLGLG