Gene Nmul_A0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0407
Symbol
ID	3785400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	450563
End bp	451768
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	55%
IMG OID	637810483
Product	phosphatase kdsC
Protein accession	YP_411107
Protein GI	82701541
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG1083] CMP-N-acetylneuraminic acid synthetase [COG1778] Low specificity phosphatase (HAD superfamily)
TIGRFAM ID	[TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA [TIGR01670] 3-deoxy-D-manno-octulosonate 8-phosphate phosphatase, YrbI family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.784801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTGGG TAGCTTTCGC GCCTTTGCAT GGAAATTTCG GGCCGGTTTC CCGAAGCAGC 
GCACGCAGCA TGGCGGGAAG GCCATTATTT TCCTGGAGCT TGGAGCAGGC CGTCATATCG 
GGATGTTTCG ACACCATTTA CGTAACTGCC GACCCGCCTG TCATTCGAAA ACGGATAGTG 
GAAGAATTTT CGCGAGCCGA CACGATAATC GAGATTCTCG ATTGCAGTGG CGCAACCCGT 
ACGGGCGTAG AGAATTGGAC CAGTCTCCTA CACACGTTTC AGCAGAAGAT CCCCTTCGAC 
GTCGTCTGTT CAATACAGGC AGCCTCGCCC CTCACGCGTG CTGAAGATTT TCGTGCCGCT 
AAGCGCAAAT TTCTTTCGGA AAATCTTGAC TCGCTTCTGA CAGCTGCGCC GTCCAGACGG 
TTTCTGTGGA CAAGGATGGG AGAACCCGTC GGTCATGACC CGCTAAAATC CCGTGCGTCA 
TGCGATGCAT CGAATCCGGA GGGATACCTG CTGGAAAATG GCGCCTTCTA TCTGACACAT 
GAAAAATTAC TTCGAGACAA CGATCATTAT CTGGGTGGAC GCATGGGTAT TCACGAGATG 
GCGCCCGAAA CTGCGATCGA GATCACCGGA GAGGCTGGCT GGAACATCGT GGAGCGTCTT 
TTACGGGAGC AGGAACGGGG GTCGGTCCAA GCCCGCGCGT CACGAATCAA GTTTCTGGTA 
CTCGATGTGG ACGGAACGTT GACGGATGCG GGAATGTATT ACGGCCCCGC CGGCGAAGCC 
TTGAAAAAAT TCAATACTCG CGACGCCCAT GGTTTGCAAC GGTTGCGTGA ACATGGCCTC 
GGGGTTTGCG TAATCACCAC CGAGACTAGT CCTTCCGTTG AAGCAAGGAT GAGAAAATTG 
CGCATCGACG AATACTACCC GGGCATAAGC GATAAATTTC CTCTCCTCCT AAAGCTTTCC 
AAACGCTGGG GGGTTCCTCT GGAAAATATC GGGTATGTGG GTGATGACCT CAGCGATCTG 
GAATGCCTGA GCCGCGTAGG CGTTGCCTTC TGCCCGGCGG ATGCTGTCCC CCTGGTCGTG 
CGGCAGGCCC ATTATATGTG TGAATATTCG GGTGGCCACG GCGCGGTTCG CGAGGTATGC 
GACTTGATTC TCCGATCAAG AGAAACCATA CGACATGACT CCGCTGAAGC GGAAGCGTAC 
TCATGA

Protein sequence

MRWVAFAPLH GNFGPVSRSS ARSMAGRPLF SWSLEQAVIS GCFDTIYVTA DPPVIRKRIV 
EEFSRADTII EILDCSGATR TGVENWTSLL HTFQQKIPFD VVCSIQAASP LTRAEDFRAA 
KRKFLSENLD SLLTAAPSRR FLWTRMGEPV GHDPLKSRAS CDASNPEGYL LENGAFYLTH 
EKLLRDNDHY LGGRMGIHEM APETAIEITG EAGWNIVERL LREQERGSVQ ARASRIKFLV 
LDVDGTLTDA GMYYGPAGEA LKKFNTRDAH GLQRLREHGL GVCVITTETS PSVEARMRKL 
RIDEYYPGIS DKFPLLLKLS KRWGVPLENI GYVGDDLSDL ECLSRVGVAF CPADAVPLVV 
RQAHYMCEYS GGHGAVREVC DLILRSRETI RHDSAEAEAY S