Gene Nmul_A2696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2696
Symbol
ID	3785058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	3100617
End bp	3101657
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	637812786
Product	PhoH-like protein
Protein accession	YP_413375
Protein GI	82703809
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAAAGAA GTTCGGTCGC TGCCAGAATT AAGACCTCAC CTCCATATTT GTGTCGCTTT 
ACCGCGCCAT TGAAGCCCAA ATCCGTAGAA ATTTCCTTTT CCCCCGCTGA CAACCAGCGT 
CTGGCGAACC TGTGTGGTGT GCTGGATGAA AACCTGAGGC AGATCGAGAC GGTTCTCGAT 
GTCGCAATTG CAAGGCGGGG AGAACATTTC AGTATCCGGG GGAAGCCACC CCAGACTTCA 
CTTGCCGCGG AAGCTCTGCA GAACTTCTAC GATCAGGCGC ACCATCCTCT GGGCATCGAA 
CAGATTCAAC TGGGCCTGAT CGAGGCGATG AATCCACATC ACCAGAAAAA ACAGGGGCCA 
GATGCCAAGG AAATAGGGGA GCCCGCCCTG TATACGCGGC GTAGCGATTT GCGCGGACGC 
ACACGCCGCC AAGTGGAGTA TCTGCACCAG ATCCAGACAC ATGACATCAC TTTTTCCATC 
GGCCCCGCAG GCACCGGGAA AACGTATCTT GCGGTTGCAA GCGCAGTGGA TGCACTCGAG 
CGGGATATCG TGGCGCGTAT CATACTGGTG CGGCCTGCGG TGGAAGCAGG CGAACGCCTG 
GGATTTTTAC CGGGTGATAT GGTGCAGAAA GTGGATCCTT ATTTGCGTCC CCTTTACGAT 
GCGCTCTACG ATCTGATGGG GTTCGATAAA ACCAGCAAAC AGTTTGAACG AAACGCAATC 
GAGGTGGCTC CGCTTGCATT CATGCGCGGG CGAACGCTGA ACCAGTCTTT CATCATTCTG 
GATGAGGCGC AAAATACCAC GCCGGAACAG ATGAAAATGT TCCTGACCCG CATCGGCTTT 
GGCTCCAAGG CCGTCGTGAC AGGGGATATC ACGCAGATTG ACCTTGCAAA ACATCAGAAA 
AGCGGCTTGG TGGAAGCCCA GCAGGTTCTT GAAAAAGTGC GGGGCATTGC CTTTACGCGG 
TTCGATGCAG AGGATGTGGT GCGGCATCCG CTGGTGCAAA GAATTGTCAA TGCCTATGAG 
AAATATGAAA GAAAGGAGTA G

Protein sequence

MQRSSVAARI KTSPPYLCRF TAPLKPKSVE ISFSPADNQR LANLCGVLDE NLRQIETVLD 
VAIARRGEHF SIRGKPPQTS LAAEALQNFY DQAHHPLGIE QIQLGLIEAM NPHHQKKQGP 
DAKEIGEPAL YTRRSDLRGR TRRQVEYLHQ IQTHDITFSI GPAGTGKTYL AVASAVDALE 
RDIVARIILV RPAVEAGERL GFLPGDMVQK VDPYLRPLYD ALYDLMGFDK TSKQFERNAI 
EVAPLAFMRG RTLNQSFIIL DEAQNTTPEQ MKMFLTRIGF GSKAVVTGDI TQIDLAKHQK 
SGLVEAQQVL EKVRGIAFTR FDAEDVVRHP LVQRIVNAYE KYERKE