Gene P9303_19541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_19541
Symbol	phoH
ID	4778183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1718617
End bp	1719588
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	57%
IMG OID	640087464
Product	PhoH-like phosphate starvation-inducible protein
Protein accession	YP_001017961
Protein GI	124023654
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.47675
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGAG TCACCTCAGA GGGTCGCTTC GTTCTGGATC TTCCCGATAC TGACGCTGCG 
CTGGCTCTTG CAGGAAACGC TGAACAGACC TTGCATCACC TTCAGGCCTT AACCGGGGCT 
TCTTTGGTGA TTAGGGGTCT TCAGCTTGTG ATCGGCGGCC GCCCAGCTCA ATTGGAACGT 
GCCGCAGCAG TGGTTGAGTT GATCAGACCT CTGTGGCAAG AAGGTCAGGC TGTTTCAGCT 
GTTGATTTAC AAGCGGCGCT CACGGCTCTT GATACTGGCC GTAGGGATGC TCATGCTGAA 
TTGGCTGATC AGGTGTTGGC CCGCAGTCAG CGAGGCAACC TGCTGCGGCC GAGGACATTG 
CGCCAGAAGG CTTATGTCGA GGCGATGGAG CGCCACGATC TCACCTTCGC TCTTGGGCCT 
GCAGGAACTG GTAAAACTTT TTTGGCCACA GTGTTGGCAG TGCGCATGCT CAGTGAGCGA 
AAGGTTGAGC GCCTGGTGTT AACTCGGCCA GCGGTTGAGG CCGGTGAAAG ATTGGGCTTT 
CTGCCTGGAG ACCTACAGCA GAAAGTGGAT CCTTATCTGC GTCCTCTTTA TGACGCTCTT 
CACGCCCTAC TAGGAGCTGA GAAAACCACC ACATTGCTGG AGAAGGGGGT AATTGAAGTG 
GCCCCCCTCG CTTATATGCG AGGACGCACC TTGGAAGAGG CTTTTGTGAT CCTCGATGAG 
GCTCAGAACA CAACGCCGGC TCAGATGCGC ATGGTGCTCA CTCGGCTTGG GGAGCGTTCG 
CGCATGGTTG TCACGGGTGA CACCACCCAG GTGGATTTGC CACCGGGCCA GCTCAGCGGA 
CTTGTGGATG CTGCTGAGGT GCTCGCTGAT CTCAACGGTG TCGCTGTCTG TCGCCTCACC 
TCTGCAGATG TGGTGCGTCA TCCGCTTGTG CAACGGGTTG TGGATGCTTA TGCGCGCCGA 
GATCAACGAT AG

Protein sequence

MAGVTSEGRF VLDLPDTDAA LALAGNAEQT LHHLQALTGA SLVIRGLQLV IGGRPAQLER 
AAAVVELIRP LWQEGQAVSA VDLQAALTAL DTGRRDAHAE LADQVLARSQ RGNLLRPRTL 
RQKAYVEAME RHDLTFALGP AGTGKTFLAT VLAVRMLSER KVERLVLTRP AVEAGERLGF 
LPGDLQQKVD PYLRPLYDAL HALLGAEKTT TLLEKGVIEV APLAYMRGRT LEEAFVILDE 
AQNTTPAQMR MVLTRLGERS RMVVTGDTTQ VDLPPGQLSG LVDAAEVLAD LNGVAVCRLT 
SADVVRHPLV QRVVDAYARR DQR