Gene Nmul_A1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1946
Symbol
ID	3785123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2237088
End bp	2238539
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	54%
IMG OID	637812033
Product	PhoH-like protein
Protein accession	YP_412633
Protein GI	82703067
COG category	[T] Signal transduction mechanisms
COG ID	[COG1875] Predicted ATPase related to phosphate starvation-inducible protein PhoH
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCCTA GAAAGCCGAG ATCTCCCACG GCTCCCAATT CATCTGCTTC CATCGCTCCG 
ATCCCCCGTC TGATGCCCAA GCTGTTTGTG CTCGACAGCA ACGTGCTCAT GCACGACCCC 
ACCAGCCTGT TCCGCTTTCA GGAACATGAC ATCTATATCA CGATGACAAC GCTGGAGGAA 
CTCGACAACA ACAAGAAAGG GATGTCGGAG GTTGCCCGCA ATGCACGTCA AACAAGCCGT 
TTTCTGGATG AAATCGTCAG CAGCGCGATA ACCGATATTG ACGAAGGCAT TTCTTTACAG 
TTGCATGGCA CCAAGAATGC AACCGGCAGG CTGTTCCTCC AGACGCAGGC GATCACGAAC 
GTCTTGCCGG TATATCTGGC AAGCGGCAGC GCGGACAACC AGATTATCGG AGCAGTCAAG 
TTTTTGCACG ATACCCACCA GAACCGCGTG GTCACACTGG TTTCCAAAGA CATCAACATG 
CGGATCAAGG CGCGAGCCTT GGGGCTGGCA GCGGAGGACT ATTTCAATGA CAAGGTTCTG 
GAAGACACTG ATGTCCTCTT CTCAGGCATC CAGGAACTGC CAGAGGATTT CTGGGATGAA 
CACGGCAAGG ACATGGAGTC CTGGCAGCAG TCGGGGCAGA CATTTTATCG TGTGACCGGC 
CCCCTTGCCG GGGGTTTTGT AATCAATCAA TTCGTCTATC TGGAGCATGA CAAACCGTTT 
TACGCGCAGG TCAAGGAGAC TAGCGGAAGA ACTGCCGTTC TGCAGACGCT GAAAGATTAT 
ACTCATCAAA AGAACAATGT GTGGGGCATC ACGGCGCGGA ATCGCGAGCA GAATTTCGCG 
TTCAACCTGC TGATGAACCC GGAAGTGGAT TTCGTCACCC TGCTGGGGCA GGCAGGTACC 
GGCAAGACGT TGCTTACACT GGCAGCAGGT CTGATGCAGA CACTGGAGCA CAAGGTATAC 
TCCGAAATCA TCATGACGCG CGTGACGGTG CCAGTGGGGG AGGATATCGG ATTTCTGCCC 
GGAACCGAGG AAGAAAAGAT GACTCCCTGG ATGGGGGCAC TGGAAGACAA CCTGGACGTG 
CTCAACAAGA CGGATAGCAG CGCCGGAGAA TGGGGACGAG CAGCGACGCT CGATCTGATT 
CGCTCCCGCA TCAAGATAAA ATCGCTCAAC TTCATGCGCG GGCGCACTTT CATCAATAAG 
TTCCTGATAA TCGACGAAGC GCAGAACCTG ACACCCAAGC AGATGAAAAC GCTTATTACC 
CGTGCCGGCC CTGCCACAAA GGTCGTGTGC CTGGGTAACA TCGCGCAGAT AGATACGCCC 
TACTTGTCGG AGGGAAGCTC AGGGTTGACC TACGTGGTGG ACCGGTTCAA GGGATGGAAT 
CACAGCGGGC ACGTCACGCT GCAACGTGGT GAGCGTTCCA GACTGGCGGA TTATGCTGCA 
GAGATACTAT AA

Protein sequence

MSPRKPRSPT APNSSASIAP IPRLMPKLFV LDSNVLMHDP TSLFRFQEHD IYITMTTLEE 
LDNNKKGMSE VARNARQTSR FLDEIVSSAI TDIDEGISLQ LHGTKNATGR LFLQTQAITN 
VLPVYLASGS ADNQIIGAVK FLHDTHQNRV VTLVSKDINM RIKARALGLA AEDYFNDKVL 
EDTDVLFSGI QELPEDFWDE HGKDMESWQQ SGQTFYRVTG PLAGGFVINQ FVYLEHDKPF 
YAQVKETSGR TAVLQTLKDY THQKNNVWGI TARNREQNFA FNLLMNPEVD FVTLLGQAGT 
GKTLLTLAAG LMQTLEHKVY SEIIMTRVTV PVGEDIGFLP GTEEEKMTPW MGALEDNLDV 
LNKTDSSAGE WGRAATLDLI RSRIKIKSLN FMRGRTFINK FLIIDEAQNL TPKQMKTLIT 
RAGPATKVVC LGNIAQIDTP YLSEGSSGLT YVVDRFKGWN HSGHVTLQRG ERSRLADYAA 
EIL