Gene A9601_19061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_19061
Symbol	ppk
ID	4718645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1642332
End bp	1644410
Gene Length	2079 bp
Protein Length	692 aa
Translation table	11
GC content	29%
IMG OID	640079641
Product	polyphosphate kinase
Protein accession	YP_001010296
Protein GI	123969438
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0855] Polyphosphate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.547171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCC AGGCTGATGT TTTTATTAAT AGAGAATTAA GTTGGATTGA ATTTAATAAG 
AGAGTTCTCC TTACTGGAAT GGAAAAGGAG TACAAAATCC TAGACAAAGT AAAATTTTGT 
TCAATTTTTA GTAATAACCT AGATGAATTT TTTATGGTAA GAGTAGCTTC ATTAAAGGCT 
CAAGTTGAAG CAGAAATTAC TAAAAAAAGT ATTGACGGAC TTACCCCTAA AGAGCAATTA 
AAAAAAATCA ATAATGAAAT AAAGAAGTTA ACTATTCTCC AAGAAAACTA TGTAAATAAT 
GAATTAAAAA ATGAATTAAA AGAAAAAGGG GTAATTTTAA AAAAATATAA GGAACTAAGT 
GATAATCAAA GAAATTGGTG TAATAACTTC TTTACAACAT CTATTTTTCC TTTATTAACT 
CCATTAGTTG TTGATCCGGC ACATCCATTT CCTTTTATAA GTAATTTAAG TCTAAATTTA 
GCAGCTTTAA TGAAGGATGA GGAGAATTCT AAAAATCAGT TTGTCAGAGT AAAAATACCA 
ACAAAAAATA TACCCCGATT TATAAGAATT CCCAATGAAA TTACTCAACT TAGTGATGAA 
AGTTCTCACT ATTTCATAAG TGTTGAAGAT TTAATTGGGA ATAATATAAA TACTTTATTT 
AACGGAATGG AATGTATAAA TTACTCTTTT TTTAGAGTGA CAAGAGATGC AGATTTAGAA 
TTAAAAGAAC TTGAAGCTGA TGATCTACTT TTAGCTGTTG AACAAAGTTT GCAAAAAAGA 
AGATTAGGTG GAGACGTAGT TAGATTAGAA GTGGAGTCAG ATATGCCAGA AAATATTCTA 
AAGTTACTTA TTGAAAGTAT CTCAATACAG AAAGAATATA TATACTTTTG CAAAAGTTTA 
TTAGGCCTAG ACGATTTAAA TCAGCTTACA AAAATTGATA GAGATGATTT AAAAGAAAAT 
CTACTAATTG GAAAAACTCA CCCAGAATTA AAACATTTAG ATTTGCCTTC AAACAAAAAC 
CCTAATTCTA TTTTCAAGAT ACTTAGGAAA AAAAATATTC TGCTTCATCA TCCCTATGAC 
CTATTTAAAA CTTCAGTTGA AGAATTTATA AACAGAGCAG CTGATGATCC ACTTGTAATG 
GCTATAAAAA TTACTTTATA TCGAGTTTCC CAAGATTCGC CTATAATTGC AGCTTTAATG 
AGAGCTGCAG AGAATGGTAA AGAAGTAATG ACTCTTGTTG AACTAAAAGC AAGATTTGAT 
GAAGACAATA ATATTCAATG GGCCAAACAA CTTGAACAAG CTGGCATTCA TGTTGTATAT 
GGAATCATCG GATTTAAAAC ACATACAAAA ATTGCCTTAA CAGTTAGAAA AGAGAAAGGA 
CGATTAAGAA ATTATTTTCA TATTGGAACA GGAAATTATA ACTCTAATAC TTCAAAGTTT 
TATACAGATT TAGGATTACT TTCAACGGAT CCTGAAATTG CTTCAGATTT ACTTGAGTTA 
TTTAACTACT TATCTGGTTT CTCTAAACAA AAAAGTTATC AAAAGTTATT AGTTTCTCCC 
TCATCGATGC GAGAGAAATT TATATTTCTG ATAAAGAGAG AAATTAAAAA TGCAGAGGAA 
GGCAAAAAAG CCGAAATAAT CGCAAAAATG AATTCTTTAG TAGACCCAGA AATAATTAAA 
CTGCTTTATT TAGCTTCAGA CTCAGGTGTA AAAATTAGCC TCATCATAAG AGGTATTTGT 
TGCCTATATC CCCAAAGAAA AAATTTAAGT GAAAATATTA AAGTTATAAG CATTATTGGC 
CATTTTCTTG AACACTCAAG AATTTTTTGG TTTTGTAATA ACGGGGATAA TGAGGTTTTT 
ATAGGGAGTG CAGATTGGAT GAGAAGAAAT CTTGATAGAA GAATAGAAGC TGTTACGCCT 
ATAGAGGATT ATGAATTGAA ATCTAAAATA TACACGCTTT TGCAAACTTA CATTAACGAT 
AATTACTTTT CTTGGATAAT GAAAGATGAT GGTTCATATT CGAAATATGA ATTAGATTCA 
TCGCATAATC GTTCGCAAAT TGACCTCATA GAAAAATAA

Protein sequence

MKRQADVFIN RELSWIEFNK RVLLTGMEKE YKILDKVKFC SIFSNNLDEF FMVRVASLKA 
QVEAEITKKS IDGLTPKEQL KKINNEIKKL TILQENYVNN ELKNELKEKG VILKKYKELS 
DNQRNWCNNF FTTSIFPLLT PLVVDPAHPF PFISNLSLNL AALMKDEENS KNQFVRVKIP 
TKNIPRFIRI PNEITQLSDE SSHYFISVED LIGNNINTLF NGMECINYSF FRVTRDADLE 
LKELEADDLL LAVEQSLQKR RLGGDVVRLE VESDMPENIL KLLIESISIQ KEYIYFCKSL 
LGLDDLNQLT KIDRDDLKEN LLIGKTHPEL KHLDLPSNKN PNSIFKILRK KNILLHHPYD 
LFKTSVEEFI NRAADDPLVM AIKITLYRVS QDSPIIAALM RAAENGKEVM TLVELKARFD 
EDNNIQWAKQ LEQAGIHVVY GIIGFKTHTK IALTVRKEKG RLRNYFHIGT GNYNSNTSKF 
YTDLGLLSTD PEIASDLLEL FNYLSGFSKQ KSYQKLLVSP SSMREKFIFL IKREIKNAEE 
GKKAEIIAKM NSLVDPEIIK LLYLASDSGV KISLIIRGIC CLYPQRKNLS ENIKVISIIG 
HFLEHSRIFW FCNNGDNEVF IGSADWMRRN LDRRIEAVTP IEDYELKSKI YTLLQTYIND 
NYFSWIMKDD GSYSKYELDS SHNRSQIDLI EK