Gene PMN2A_1082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMN2A_1082
Symbol	psaA
ID	3606469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL2A
Kingdom	Bacteria
Replicon accession	NC_007335
Strand	+
Start bp	1577169
End bp	1579475
Gene Length	2307 bp
Protein Length	768 aa
Translation table	11
GC content	42%
IMG OID	637687952
Product	photosystem I P700 chlorophyll a apoprotein A1
Protein accession	YP_292275
Protein GI	72382920
COG category
COG ID
TIGRFAM ID	[TIGR01335] photosystem I core protein PsaA

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA GCCCACCAGA AAAAGAACAA AAAAAAGAAC CGGTTCTCGA TAAACCTATC 
GAAACTGATG CAATCCCTGT AGATTTTTCC AAGCTTGATA AGCCTGGTTT TTGGTCAAAA 
TCCCTTGCTA AAGGGCCAAA GACTACTACA TGGATATGGA ATCTTCATGC TGATGCGCAT 
GATTTTGATA CTCATGTTGG AGATCTCCAA GAAACCAGTA GAAAAGTATT TTCTGCTCAT 
TTTGGACATC TAGCAGTCAT CTTTATTTGG ATGAGTGCAG CTTTTTTCCA TGGAGCTCGC 
TTTTCTAATT ATTCTGGATG GCTCTCTGAT CCAACTCATG TCAAGCCAGG AGCACAAGTT 
GTTTGGCCAA TAGTTGGTCA GGAGATGCTT AATGCGGATT TAGGCGGTAA TTATCACGGT 
ATTCAGATCA CTTCTGGAAT TTTTCAGATG TGGAGAGGCT GGGGAATTAC CAATGAAACC 
GAGCTCATGG CTTTAGCTAT TGGTGCACTA CTAATGGCAG CCATAATGTT GCACGGTGGC 
ATATATCACT ATCACAAAGC TGCTCCCAAG CTTGATTGGT TTAGAAATCT AGAGTCTATG 
CTCAATCACC ACATAGCTGG TCTAGTGGGA TTGGGTTCGA TTGCATGGGC TGGACATTGC 
ATTCACATTG GTGCACCTAC AGCAGCACTC ATGGATGCAA TTGATGCAGG AAAGCCTCTA 
ATTATTGATG GAATTCCAAT TGCTTCGATT GCGGACATGC CTCTGCCCCA CGAGCTTTGC 
AATCCTGCTA TTGCTAGTCA AATATTCCCT GGCCTCGCTG GAAGAACAGT TGAAAATTTC 
TTTACGACTA ATTGGTGGGC GTTTAGTGAT TTCCTAACTT TCAAAGGTGG TCTAAATCCA 
GTTACTGGTA GCTTATGGAT GACAGATATT TCTCATCATC ATTTAGCTTT TGGAGTACTA 
GCTGTATTGG GCGGTCATCT ATATAGAACA ATGTTTGGCA TTGGCCATAG CCTGAAAGAA 
ATACTAGATA ATCATGCTGG AGATCCAATT CTTTTCCCTG CTCCAAATGG TCATAAAGGG 
ATTTATGAGT TTTTAGCTAA TAGTTGGCAT GCTCAGCTTG GTTTAAACCT TGCAATGATT 
GGCTCCTTGA GCATCATCAT TTCCCATCAC ATGTATGCGA TGCCCCCATA TCCGTACTTG 
TCGATTGATT ACCCAACTGT CCTAGGTCTA TTCACTCACC ACATGTGGAT AGGAGGATTA 
TTCATTGTTG GTGCAGCAGC TCATGCTGGT ATTGCAATGA TTAGAGACTA TGACCCAGCT 
GTTCATATTG ATAACGTTCT AGACAGAATC TTGAAAGCAA GAGATGCATT AATTAGTCAT 
CTGAATTGGG CTTGCATGTT CTTAGGTTTC CATAGTTTTG GTCTTTATAT TCATAACGAT 
GTAATGCGTG CATTAGGAAG ACCTGCAGAT ATGTTCAGTG ATACAGGAAT CCAACTTCAA 
CCTGTTTTTG CTCAGTGGAT TCAAAATATT CATAATTCAG CAGCTGGTTC TACCACTCTT 
GCTGGTGCAA ACGTAAGCCT TCAACCTGGA TTAGTTAGTG AAGTTTTTAA TGGTTCCGTA 
AGTCAAGTTG GAGGAAAAAT TGGAATCGCT CCTATACCTT TAGGAACTGC TGATTTCATG 
ATTCACCATA TCCATGCTTT TACTATCCAC GTAACCCTTC TGATTCTTCT AAAAGGAGTT 
TTATTCGCAA GGAGCTCCAG ACTAATTCCT GACAAAGCGA ATCTTGGATT TAGATTCCCA 
TGTGATGGAC CAGGAAGAGG AGGTACATGC CAAGTTTCAT CTTGGGATCA TGTTTTCCTT 
GGATTGTTCT GGATGTATAA CGGCTTATCA GTAGTTATCT TCCACTTCTC ATGGAAGATG 
CAAAGTGATG TATGGGGTCT AACAGGAGGA AACTTTGCTC AAAGTTCCAT AACTATCAAT 
GGATGGCTTA GAGATTTCCT ATGGGCTCAG TCATCTCAGG TCCTAACAAG TTATGGTCAA 
CCTATAAGCA TGTACGGTTT GATGTTCTTA GGAGCTCATT TCGTTTGGGC ATTTAGTCTT 
ATGTTCCTAT TTAGTGGACG TGGTTACTGG CAAGAGTTAT TTGAGTCAAT CATTTGGGCT 
CATAATAAAC TTAACTTGGC TCCAACCATC CAACCAAGGG CTTTATCTAT CACTCAAGGT 
CGCGCAGTAG GAGCAGCTCA TTTCCTTCTT GGAGGAATTG CTACAACTTG GGCCTTCTTC 
CATGCTCGCT TAATTGGTCT CGGCTGA

Protein sequence

MTISPPEKEQ KKEPVLDKPI ETDAIPVDFS KLDKPGFWSK SLAKGPKTTT WIWNLHADAH 
DFDTHVGDLQ ETSRKVFSAH FGHLAVIFIW MSAAFFHGAR FSNYSGWLSD PTHVKPGAQV 
VWPIVGQEML NADLGGNYHG IQITSGIFQM WRGWGITNET ELMALAIGAL LMAAIMLHGG 
IYHYHKAAPK LDWFRNLESM LNHHIAGLVG LGSIAWAGHC IHIGAPTAAL MDAIDAGKPL 
IIDGIPIASI ADMPLPHELC NPAIASQIFP GLAGRTVENF FTTNWWAFSD FLTFKGGLNP 
VTGSLWMTDI SHHHLAFGVL AVLGGHLYRT MFGIGHSLKE ILDNHAGDPI LFPAPNGHKG 
IYEFLANSWH AQLGLNLAMI GSLSIIISHH MYAMPPYPYL SIDYPTVLGL FTHHMWIGGL 
FIVGAAAHAG IAMIRDYDPA VHIDNVLDRI LKARDALISH LNWACMFLGF HSFGLYIHND 
VMRALGRPAD MFSDTGIQLQ PVFAQWIQNI HNSAAGSTTL AGANVSLQPG LVSEVFNGSV 
SQVGGKIGIA PIPLGTADFM IHHIHAFTIH VTLLILLKGV LFARSSRLIP DKANLGFRFP 
CDGPGRGGTC QVSSWDHVFL GLFWMYNGLS VVIFHFSWKM QSDVWGLTGG NFAQSSITIN 
GWLRDFLWAQ SSQVLTSYGQ PISMYGLMFL GAHFVWAFSL MFLFSGRGYW QELFESIIWA 
HNKLNLAPTI QPRALSITQG RAVGAAHFLL GGIATTWAFF HARLIGLG