Gene Nmul_A0992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0992
Symbol
ID	3785822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1150919
End bp	1152049
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	56%
IMG OID	637811075
Product	acetate kinase
Protein accession	YP_411687
Protein GI	82702121
COG category	[C] Energy production and conversion
COG ID	[COG0282] Acetate kinase
TIGRFAM ID	[TIGR00016] acetate kinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTCCG CTCAAGCCCT TGCCATGAAA ATTTTGACGG TCAACACAGG CAGCTCATCG 
GTACGCCTGG CAGCATTCCT TCACCATCAG GAAAAGCTGA CGGAGCTTGT GAGTGTCAGG 
GAAGATTCCG GTGGTGAGCC GGAAGATATC CTCCAGGAAT TCGTGCAGGT CCACAAACTT 
GGCAAGGTGA ATGTCGTGGC GCATCGCGTC GTGCATGGAG GCATGCGTCT TACTTCCCCT 
TGCGTGATCG ATCGCGACGT GGAGAGGGAA ATCGAATGTC TTGCGCCGCT TGCGCCCTTG 
CATAACCCCG TCGCACTGGA GTGGATACGT GCCGCCAAGG AAGTATTCGG TATTCATATG 
CCGCAAGTTG CAGTATTCGA CACCGCATTT TTTACCCATC TGCCGACAGT TGCGCAAACT 
TACGCAATTC CGCATGAGCT GACCGGAAAG TACGCATTGC GGCGGTACGG TTTTCACGGA 
CTGGCGCACC AGGCTATGTG GCAGGCTTGG CGCGATCAAC ATCCGGACTT TGTGCAAAAT 
GGAAAAATCA TTTCGATGCA GTTCGGAGCA GGTTGCTCGA TCACGGCGAC AGAGAAAGGA 
TTGCCTCGCG ATACTTCCAT GGGATTCTCG CCTCTGGAGG GATTGATGAT GGCGACGCGC 
TCGGGCGACC TGGACCCCGG TCTGATGACG TTTTTGCAGC GGCAGGAGAG CTTGGCGCCG 
GAGCAGATGG ATCGGCTGCT GAATGAGCAG TCCGGTTTAT CGGGAGTGTC GGGAATCAGC 
GCCGATATCC GGGAACTGCT GAAGTCGAAA GACGAATACG CTGGGCTGGC GGTCGAGCTG 
TACTGTTACC GGGCGCGTAA ATATCTGGGC GCTTATCTTG CCGTGCTGGG CGGGGCAAAT 
GCAGTGATTT TTGGCGGGGG CGTGGGGGAG AACGTTCCAG TCGTGCGGGA AAAGATTCTG 
GCAGGAATGG AATGGTGCGG AATCCATCTC GACGCGAAAA AGAACAGCGA TGCGAGCGGG 
ATGTCATGCA TCAGTAGCGA AGCGAGTCGG GTCGAAGTGT GGGTGGCTCC CGTGAATGAG 
GCGACAATCC TCGCGCAGGA AGCAGAGGCA GTTATTTCCA GTCGTGGCTA G

Protein sequence

MRSAQALAMK ILTVNTGSSS VRLAAFLHHQ EKLTELVSVR EDSGGEPEDI LQEFVQVHKL 
GKVNVVAHRV VHGGMRLTSP CVIDRDVERE IECLAPLAPL HNPVALEWIR AAKEVFGIHM 
PQVAVFDTAF FTHLPTVAQT YAIPHELTGK YALRRYGFHG LAHQAMWQAW RDQHPDFVQN 
GKIISMQFGA GCSITATEKG LPRDTSMGFS PLEGLMMATR SGDLDPGLMT FLQRQESLAP 
EQMDRLLNEQ SGLSGVSGIS ADIRELLKSK DEYAGLAVEL YCYRARKYLG AYLAVLGGAN 
AVIFGGGVGE NVPVVREKIL AGMEWCGIHL DAKKNSDASG MSCISSEASR VEVWVAPVNE 
ATILAQEAEA VISSRG