Gene Nmul_A1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1107
Symbol
ID	3785687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1275224
End bp	1276213
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	55%
IMG OID	637811192
Product	serine/threonine protein kinase
Protein accession	YP_411802
Protein GI	82702236
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGAACAG CAGATAATTC GGCTCCAAAT GATTTCTCCA CGCTTTCTCC TGAACGCGTG 
TTGCATGCTT TGGAAAGCTT GGGTTTCCAC AGCGATGGAC GGCTGCTGGC ACTCAACAGC 
TACGAGAACC GCGTCTACCA AATCGGCCTC GAAAACGGTG CGCCAGTCAT AGCAAAATTC 
TACCGCCCGG AACGCTGGAC GAACAACGCC ATTCTCGAGG AACACGCGTT CGTGCGGGAA 
CTGGCCGAGC ACGAAATTCC TGTAGTACCC CCATTGGTGC TGCAAGGAAT ATCGCTGCAT 
TATTTTGAGG GATTTCGTTT CACTGTTTTT CCAAGGCATG GTGGTCGCGC GCCCGAACTG 
GAAGATCCCC ATACCCTGGA ATGGATGGGG CGCTTCCTAG GACGTATCCA TGCGGTTGGC 
GCACTGAATC CCTTTCTTGA ACGCCCGGAA TTGAATATCG CCAACTTCGG CGAACAACCC 
CGCGACTATC TGTTGGCACA TGGATTCGTT CCGCCTGATA TTGAGGCTGC CTATCGCAGT 
GCCGTGAATC AGGCGTTAGA CAGTGCACGG CACTGTTTTG GACGCGCAGG TAAAGTACGC 
GCGTTACGCC TGCACGGGGA CTGTCATGCA GGCAATGTTT TGTGGACTGA CGATGGACCG 
CACTTCGTCG ATTTTGACGA CAGCCGCATG GGACCAGCAG TACAGGACTT GTGGATGCTG 
TTATCCGGCG AACGGGCCGA CATGAGGAAG CAGTTGGACA GCGTGCTGGC CGGGTATGAA 
AACTTCTTCG ATTTCGACGA AAGGGAATTG CATCTGGTCG AGGCGTTACG CACTCTGCGC 
TTGATCCACT ACGCGGCGTG GCTTGCACAG CGATGGGACG ACCCTGCTTT CAAGCGAGCG 
TTTCCCTGGT TCAACACCCA ACGCTACTGG CAGGATCGCA TTCTCGAATT GCGGGAGCAG 
ATCGCCCTTA TGGATGAACC GCCGCTATGA

Protein sequence

MGTADNSAPN DFSTLSPERV LHALESLGFH SDGRLLALNS YENRVYQIGL ENGAPVIAKF 
YRPERWTNNA ILEEHAFVRE LAEHEIPVVP PLVLQGISLH YFEGFRFTVF PRHGGRAPEL 
EDPHTLEWMG RFLGRIHAVG ALNPFLERPE LNIANFGEQP RDYLLAHGFV PPDIEAAYRS 
AVNQALDSAR HCFGRAGKVR ALRLHGDCHA GNVLWTDDGP HFVDFDDSRM GPAVQDLWML 
LSGERADMRK QLDSVLAGYE NFFDFDEREL HLVEALRTLR LIHYAAWLAQ RWDDPAFKRA 
FPWFNTQRYW QDRILELREQ IALMDEPPL