Gene A9601_14831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14831
Symbol	phoH
ID	4718204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1263387
End bp	1264343
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	36%
IMG OID	640079204
Product	PhoH-like phosphate starvation-inducible protein
Protein accession	YP_001009873
Protein GI	123969015
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.384424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAG TTTCCAAAAC TGGTCACTTC ACAATAGATC TGCCAAGCTC TGATGCTGCT 
ACAGCATTAT CTGGACCTGG TAATTCTTTC TTAAAAAAAT TTGAGTCTCT TACAGGAGTT 
TCTTTAACTA TAAGGGGCTT ACAACTTGAG ATGAACGGTG TCATATCTAA AATTGAGAGA 
GCCTCAGCAT TAGTAGAACT AACAAGACCA ATTTGGGAAC AAGGGTTAGA AGTCCCAGAG 
GTAGATCTTA AAGCGGCTTT AAGTTCTTTA AATATGGGCG AATCGTCTTC ACATGCTGAA 
CTAGGAAAAA AAATTCTTGC GCGTTCCAAA GAAGGAAGAT ATTTAAGACC AAGAACTATA 
AGACAAAAAG AATATGTTGA ATCAATTGAA AGCTTTGATC TTACCTTTGC GATCGGTCCA 
GCTGGAACTG GTAAGACATT TTTAGCAACT GTTTGCGCGG CAAGACTATT AAACGAGAAA 
AAAATTGAAA AAATTATTTT AACCAGACCA GCTGTAGAAG CTGGTGAAAG TTTGGGATTC 
CTACCTGGTG ATTTGCAACA AAAAGTAGAT CCATATTTAA GACCCTTATT TGATTCTTTA 
CATAGTATTT TCGGGATTGA CAGAACAAAT TCGTTAATTG ATAAGGGAAT TATTGAAGTT 
GCTCCTTTGG CATTTATGAG AGGCAGAACC TTAGATAACT CCATAGTTAT CCTAGATGAA 
GCGCAAAATA CTACTTGCTC TCAAATGAGA ATGTTTTTGA CCAGATTAGG AGAGAGATCC 
AAAATGGTTG TAAATGGAGA TATTACACAA ATTGATTTAA AAAAAGATCA GGAAAGCGGC 
CTCATCGAAG CATCGAGAAT TTTCTCAAAA ACTCAAGATA TAAAATTTTG TTATTTAACT 
GTTGAAGATG TGGTTCGTCA TCCTTTAGTT CAGAAAATTA TTGAGGCTTA TCAATAA

Protein sequence

MKEVSKTGHF TIDLPSSDAA TALSGPGNSF LKKFESLTGV SLTIRGLQLE MNGVISKIER 
ASALVELTRP IWEQGLEVPE VDLKAALSSL NMGESSSHAE LGKKILARSK EGRYLRPRTI 
RQKEYVESIE SFDLTFAIGP AGTGKTFLAT VCAARLLNEK KIEKIILTRP AVEAGESLGF 
LPGDLQQKVD PYLRPLFDSL HSIFGIDRTN SLIDKGIIEV APLAFMRGRT LDNSIVILDE 
AQNTTCSQMR MFLTRLGERS KMVVNGDITQ IDLKKDQESG LIEASRIFSK TQDIKFCYLT 
VEDVVRHPLV QKIIEAYQ