Gene A9601_16531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_16531
Symbol	atpA
ID	4718383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1397246
End bp	1398763
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	38%
IMG OID	640079379
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_001010043
Protein GI	123969185
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.592214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATCTA TACGCCCTGA TGAAATCAGT TCAATCTTAA AACAACAAAT AACTGATTAT 
GACCAATCTG TAAGTGTTAG CAATGTAGGA ACTGTTCTGC AAATCGGTGA TGGCATTGCA 
AGAATATATG GCTTAGATCA GGTCATGGCA GGTGAGTTGT TGGAATTTGA GGATGGTACC 
GAAGGTATAG CTTTAAATCT TGAAGATGAT AATGTTGGGG CCGTTTTAAT GGGAGAGGCA 
CTTGGTGTCC AAGAAGGAAG TAACGTTAAG TCCACAGGTA AAATCGCATC TGTTCCAGTT 
GGTGAAGCAA TGCAGGGGAG AGTTGTTAAC CCTCTCGGAC AACCAATAGA TGGGAAAGGG 
GAAATTCCAA CAAGTGATAC AAGATTGATT GAAGAAATGG CGCCTGGAAT AATCAAAAGA 
AGATCAGTTC ATGAACCAAT GCAAACTGGT ATCACATCTA TTGATGCAAT GATTCCTGTT 
GGAAGAGGTC AAAGAGAATT AATTATTGGC GATAGACAAA CTGGAAAATC TGCGATTGCT 
ATCGATACAA TTATCAACCA AAAAGGTCAA GATGTAGTTT GTGTATACGT AGCTATTGGT 
CAGAAGTCAG CATCAGTAGC AAATATCGTA GAGGTTTTAA GAGAGAGAGG AGCTCTAGAT 
TACACCGTTG TAGTTAGTGC AGGAGCTTCA GAACCAGCTG CTTTACAGTA CTTAGCACCT 
TATACTGGTG CAGCAATTGC TGAGCATTTT ATGTATCAGG GTAAAGCAAC ACTTGTTATT 
TATGATGATC TAACAAAACA AGCTCAGGCT TACAGACAAA TGTCTCTTCT TTTAAAAAGA 
CCACCAGGAA GAGAGGCTTA TCCTGGAGAC GTGTTCTACT TGCACAGTAG ATTACTAGAA 
AGAGCAGCAA AACTTTCTGA TGCAATGGGC GGGGGTTCTA TGACAGCTCT TCCAATTATT 
GAAACTCAGG CAGGAGACGT TTCGGCTTAC ATTCCAACTA ATGTTATTTC AATTACGGAT 
GGACAAATAT TCTTGAGTGC AGATTTATTT AACTCAGGAT TAAGACCAGC TATTAATGTT 
GGTATATCTG TTAGTCGTGT TGGAGGAGCA GCTCAGACAA AAGCAATTAA AAAAATTGCA 
GGAACTTTAA AATTAGAACT CGCACAGTTT GATGAACTAG CTGCTTTTTC TCAATTTGCA 
TCTGATCTTG ATGAAGCAAC TCAGCAACAA CTTGAAAGAG GCAAAAGACT AAGAGAGCTA 
TTAAAGCAAC CTCAATTCTC TCCTCTAAAC CTTGCAGAAC AAGTTGCAGT TGTTTATGCA 
GGAGTAAAAG GTCTTATTGA TGAGGTTCCT GTTGAAGATG TTACTAAATT TGCAACTGAA 
CTTAGGGAAT ACCTAAAATT AAATAAATCA GAATTTATAG AAGAGATTCT TAAAGAAAAG 
AAACTAAATG ATGGATTAGA AGCGACACTA AAAGAGGTGA TAAATGAAGT TAAATCATCA 
ATGCTTGCCA CAGTTTAA

Protein sequence

MVSIRPDEIS SILKQQITDY DQSVSVSNVG TVLQIGDGIA RIYGLDQVMA GELLEFEDGT 
EGIALNLEDD NVGAVLMGEA LGVQEGSNVK STGKIASVPV GEAMQGRVVN PLGQPIDGKG 
EIPTSDTRLI EEMAPGIIKR RSVHEPMQTG ITSIDAMIPV GRGQRELIIG DRQTGKSAIA 
IDTIINQKGQ DVVCVYVAIG QKSASVANIV EVLRERGALD YTVVVSAGAS EPAALQYLAP 
YTGAAIAEHF MYQGKATLVI YDDLTKQAQA YRQMSLLLKR PPGREAYPGD VFYLHSRLLE 
RAAKLSDAMG GGSMTALPII ETQAGDVSAY IPTNVISITD GQIFLSADLF NSGLRPAINV 
GISVSRVGGA AQTKAIKKIA GTLKLELAQF DELAAFSQFA SDLDEATQQQ LERGKRLREL 
LKQPQFSPLN LAEQVAVVYA GVKGLIDEVP VEDVTKFATE LREYLKLNKS EFIEEILKEK 
KLNDGLEATL KEVINEVKSS MLATV