Gene Nmul_A0727 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0727
Symbol
ID	3786073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	847284
End bp	848714
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	53%
IMG OID	637810809
Product	putative signal transduction histidine kinase
Protein accession	YP_411426
Protein GI	82701860
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAGCC GGGATAAAAG GCACTTCAAC TCCGTCCATT CCCCTGTGGA TGAACATGCT 
GACGCAAGTC AGGCGCTTCG CGAGCGCCTG AAAGAAATCA CCTGTCTCTA TGAAATTCGC 
CGGGGCATGG GGCCGGAATT ATCGGTGGAG AACGTTTGCC GGCAGATTTT CGAGCACTTG 
ATACACGCGA TGCAATTTCC GGAAATTGCT ACCGCCATGA TCGAGCTCGA CGGCAGACGC 
TTCATTTCCC AGAATCACGA CGAAGGTGCC ACGCATGAGC TGCAATCGAC GATTAACGTC 
AACGCCCATC CTTGTGGCCA GCTACGGGTC TTCTATCCGG AAGATAAACC TTTCCTGGTG 
CCGGAAGAAC AGCGGCTCAT CGACGCGATC GCAACTGATC TGGGAAGGTG GTTTGAGCGC 
AAACAGATCG ACGAGGCGTT GCGCGAGCGT CTGAAAGAAA TCACTTGCCT CTACGAGATT 
CGCCATGGCA TGGGAGTGGA ATTATCGGTG GACAACGTCT GCCAGCAGAT TTTCGAGCAC 
CTGATACCCG CGATGCAATT TCCGGAAATT GCTACCGCCA TGATCGAACT CGATGGCAAG 
CGCTTCACTT CCAAGAACCA CGGTCAGGGT CTTACGCACG AACTGAAATC GACGATCAGC 
GCCAACAACC ATTCCTGCGG CCAGTTGCGT GTCTTCTATC CCGAAGACAA ACCTTTCCTG 
GTGCCGGAAG AACAGCGGCT CATCGACGCG GTTGCGACTG ATCTGGGGAG ATGGTTTGAG 
CGCAAACATC TCGAGCAAAC CCTGGTTTCC ATAGCGGAAG AACATCAGCG TTCGATCGGC 
CAGGATTTAC ACGACAATCT CGGGCAGCAG ATTGCAGCGA TTGGCTATCA GGCCAAAGCG 
CTGCAGAAAA AAATATCCTC GTTGGGGAGT ACGGATGCCG CAACCGTCGC TGCTTCCATC 
GCGACTCAAG CACAGATCGC CGTGATGCAA TGCAAGCAGC TTGCGCAGGG GCTGCTCCCA 
TTTGAACTGG AGACCCATGG CCTGGTGGCC GCACTGCGGG CATTTGCATC CAGAATCGCA 
ATCACTTACA AGATTACTTG TGATTTTATA TGCAAAAATG AAGTTCTCAT CAAGGATAAG 
GATCTTGCGC TTAATATTTA CCGGATTGCC CAAGAGGCCA CCAATAACGC AATACGCCAC 
GGGAGCGCAC AGCATGTGAC AATTTCGCTG GATTCCGAGG AAGAAATGCT CTCTCTGTCG 
ATACGCGATG ATGGCGGCGG CTTTGCCGGT TTTAACACAA AAGAGGGAGC GACTCCAGGA 
ATGGGTATTA AAATCATGCA ATATCGCGCC CGGCAGCTTG GCGCAATACT GGAATTCGTG 
TCGCATCCCG AAGGCGGAGT GGAAGTGCGG CTCGAAATGC GAATGATGTA G

Protein sequence

MISRDKRHFN SVHSPVDEHA DASQALRERL KEITCLYEIR RGMGPELSVE NVCRQIFEHL 
IHAMQFPEIA TAMIELDGRR FISQNHDEGA THELQSTINV NAHPCGQLRV FYPEDKPFLV 
PEEQRLIDAI ATDLGRWFER KQIDEALRER LKEITCLYEI RHGMGVELSV DNVCQQIFEH 
LIPAMQFPEI ATAMIELDGK RFTSKNHGQG LTHELKSTIS ANNHSCGQLR VFYPEDKPFL 
VPEEQRLIDA VATDLGRWFE RKHLEQTLVS IAEEHQRSIG QDLHDNLGQQ IAAIGYQAKA 
LQKKISSLGS TDAATVAASI ATQAQIAVMQ CKQLAQGLLP FELETHGLVA ALRAFASRIA 
ITYKITCDFI CKNEVLIKDK DLALNIYRIA QEATNNAIRH GSAQHVTISL DSEEEMLSLS 
IRDDGGGFAG FNTKEGATPG MGIKIMQYRA RQLGAILEFV SHPEGGVEVR LEMRMM