Gene NATL1_17041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_17041
Symbol	phoH
ID	4780886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1387996
End bp	1388973
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	39%
IMG OID	640084988
Product	PhoH-like phosphate starvation-inducible protein
Protein accession	YP_001015524
Protein GI	124026409
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAG CAACCACTGA AGGTCGCTTT TGTATAGATC TGCCTGATTC CGATGCTGCT 
ACTGCTTTAG CGGGAACTGG TCAGTCAACA CTTCATAGAT TAGAAACCCT AACAGGTGCT 
GCTTTTGCCT TAAGGGGGTT GCAACTCGAA ATAAAAGGAA ATTCTTACCA ATTAGAAAAA 
GCTGCAGCAA TTGTTGAATT AGTTAGACCA ATTTGGGAAG AAGGGCAAAT TGTCTCGCCC 
GTTGATTTAC ATGCCGCGGC TAAAGCATTG GACAATGGTA AAAAAAATGA TCATGCCAAA 
TCCACAAATA AAGTTTTAGC GAGAAGTCAA AGAGGAAATC TTTTAAGACC AAGAACAATT 
AGACAAAAAT TATATGTAGA AGCTATGGAA AAAAGTGATC TTACTTTTGC TTTAGGCCCA 
GCAGGAACAG GAAAAACTTT CTTGGCAACT GTATTAGCTG TGCGAATGCT AACTGAGAGG 
AAAATCGAGA AAATTATTTT GACAAGACCT GCAGTTGAAG CTGGCGAAAG ATTGGGATTT 
TTACCTGGGG ACTTACAGCA AAAGGTTGAT CCTTATCTAA GGCCTTTATA TGATTCTCTC 
CACTCTTTAC TTGGACAAGA AAAAACTAAT TTGCTTATAG AAAAAAACGT GATTGAAGTT 
GCGCCTTTGG CTTACATGCG AGGAAGGACT TTAGAAGAAT CATTTGTCAT ACTTGATGAG 
GCACAAAATA CGACACCAGC ACAAATGAGG ATGGTTCTTA CCAGATTAGG TGAGAGGTCA 
AGGATGGTAG TAACTGGCGA TATAACTCAG GTTGACTTGC CATATGGACA AATGAGCGGA 
CTTATAGAAG CAGCAGACTT ACTAGAAAAG GTTGATGGAA TTTCAGTTTG CAGACTTACT 
TCAGCAGATG TAGTAAGACA TCCACTTGTT CAAAGCGTTG TTGATGCTTA TGCAGAACTA 
GATAAAAAAA GACGATAG

Protein sequence

MSEATTEGRF CIDLPDSDAA TALAGTGQST LHRLETLTGA AFALRGLQLE IKGNSYQLEK 
AAAIVELVRP IWEEGQIVSP VDLHAAAKAL DNGKKNDHAK STNKVLARSQ RGNLLRPRTI 
RQKLYVEAME KSDLTFALGP AGTGKTFLAT VLAVRMLTER KIEKIILTRP AVEAGERLGF 
LPGDLQQKVD PYLRPLYDSL HSLLGQEKTN LLIEKNVIEV APLAYMRGRT LEESFVILDE 
AQNTTPAQMR MVLTRLGERS RMVVTGDITQ VDLPYGQMSG LIEAADLLEK VDGISVCRLT 
SADVVRHPLV QSVVDAYAEL DKKRR