Gene Nmul_A1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1000
Symbol
ID	3785830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1160959
End bp	1162116
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	49%
IMG OID	637811083
Product	histidine kinase
Protein accession	YP_411695
Protein GI	82702129
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.146298
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCTGG CAAGCGACCA AAATATCAAT CCTGAGAAAC TTTCCGCAAC CGCTCGAAGA 
ATGCTCGAGC TTCGAGATGA AGTACTTTCG GAATGGATGA AAAGGGTTCG AAACAGCATC 
AAGGAAGCCG AGCATTTACC CAATCCAATA ATCATCAATA CCTTTCCCGC CCTGTACGAT 
AACCTTGCCG AAGCTATTAC GCCTGATTAT CCAAGAGCAA CAGGAAATGA GGGTACTACG 
GTGGCGGCGG AGCACGGTGG GGAGCGAGCG CGCCTTACAA GCTATAACGC GCACTCGGTA 
ATCGCGGAAT ATCAGCAACT GCGGTGGACA ATCTTTGATG TTCTAAAGAT GAATGACGTA 
CGCCTCAATG ACCGTGAAAT TTACATTATC AATGCCTCTA TCGATGGATC AATCCGTGAG 
GCTGTCAACG CCTTCGCCTT GACCCAGGCA GCGCTCCAGG AAAGATTTGT TGCAACACTT 
GCTCACGACC TGAGAAATCC ATTATCGAAT GCCCATCTTG CCGCCCAGTT GATCAAATCC 
ACGTCCGATT TGAACAAGAT AAAGGAATTT GCGGAAGGAA TCATGAACAA CCTGAGTCGA 
ATGGATGGAA TGATTCGCGA TTTGCTCGAC TCGATAAAAT TCCACATGGG AGAACAATTA 
CACCTGCGGC TCAAGGAATT CGACATACAG GAAGTCATGA AGGAAGTACT CGACAGCTTC 
ACCGCCATTC ATGGGGCACG CTTCCGTCTG ATCGGCACTT CTATCACAGG ATGGTGGGAC 
CGGGAGGCAA TCAAACGGGC GGTGGAAAAT ATTATTGGAA ATGCAGTGAA ATATGGCTCT 
GCCGATACGC CTGTTCGAAT CAAGATTGCT TCACAAAACG AGCGCATGCT ACTGTCTGTG 
CATAACGAAG GGGAATTCAT TCCACCTGAA CAAATCGAGA GTATATTTCA AATATTCGGA 
AGAGCAGAGG CCGCAAAAAA GGGAAACAAG GAAGGCTGGG GTATTGGCTT GCCGTATGTG 
CGAAGTGTTG CGGAAACCCA TGGTGGCAGT GTCGCGGTCG ATAGCTCACC TTATCGCGGC 
ACAACCTTCA CGATAGATAT TCCGGTGGAT GCAAGACCTT ATCAAGGTGC CTTGCAACCT 
TCCCGGAAGC CGGAATGA

Protein sequence

MTLASDQNIN PEKLSATARR MLELRDEVLS EWMKRVRNSI KEAEHLPNPI IINTFPALYD 
NLAEAITPDY PRATGNEGTT VAAEHGGERA RLTSYNAHSV IAEYQQLRWT IFDVLKMNDV 
RLNDREIYII NASIDGSIRE AVNAFALTQA ALQERFVATL AHDLRNPLSN AHLAAQLIKS 
TSDLNKIKEF AEGIMNNLSR MDGMIRDLLD SIKFHMGEQL HLRLKEFDIQ EVMKEVLDSF 
TAIHGARFRL IGTSITGWWD REAIKRAVEN IIGNAVKYGS ADTPVRIKIA SQNERMLLSV 
HNEGEFIPPE QIESIFQIFG RAEAAKKGNK EGWGIGLPYV RSVAETHGGS VAVDSSPYRG 
TTFTIDIPVD ARPYQGALQP SRKPE