Gene Nmul_A1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1959
Symbol
ID	3784982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2252646
End bp	2253647
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	55%
IMG OID	637812047
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_412646
Protein GI	82703080
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCGA TACTGATGAA TGCTCCGGGT GCACCAGAGG TGTTGACACC TGCCGACGTT 
CCCATGCCCG ATCTTGCCGG CGCATTTGAT GTGCGGGTAA AGTTGCACGC GGCGGGCGTA 
AACCCGATCG ATACCAAGGT GCGCAAGGCC AATATGTATT ACCCGGACAG GCTTCCGTCC 
ATTCTCGGAT GTGATGGGGC GGGTGTGGTT GAAGCCGTTG GCAGTTCAGT GACCCGGGTA 
CGCGCAGGCG ATGAAGTCTT CTTTTTCAAT AACGGTTTGG GCGGAGCGCC CGGAAACTAT 
GCGGAATATG CGGTAGTGCA TGAAGATTAT CTGGCATTGA AACCTGGGAA TCTGTCAATG 
GTGGAAGCAG CCGCTGTTCC GTTGGCTCTG ATTACCGCCT GGGAAGCACT GATAAAGCGT 
GGCAATCTCA AGGGGAGCCA GATTGCGCTG ATTCATGCCG GCGCGGGTGG CGTGGGTCAT 
ATTGCCATCC AGCTTGCCCG ATACCTGAAG GCCCGGGTTG CAACGACAAT TTCGAGCGAG 
GAAAAGGCTG CCTTCGTGCA ATCCCTGGGA GCCGAGCTTG CAATCGATTA TCGCGAAAAT 
GACTTTGTGG ACACTGCGCT CGAATGGACG GAGGGACTGG GTGTGAACCT CGCTCTGGAT 
ACTGTCGGTG GAGAGACGTT CTGCAAATCC TTCTCCGCCA TCCGGCTGTA TGGCAGGGTG 
GTATCGCTGC TTTCAACGGT CTGTGATGCA AAGCAGCTCA ATACTGCCCG ACTGCGCAAC 
CTGAGCATCG GCTATGTGCA AATGACTGCT CCCCTTTATT TCGGTTTACA TTCGGCGCGT 
GTAGTCCAAA CCGGCATACT TGAACAAGGT GCAAGACTGC TCGAACAAGG TATTCTCAAG 
ATTCACGTCA GCCGCACGCT GCCTCTGACG GAAGCCGCCG AAGCGCATCG TTTGATCGAA 
GCGGGGCATA CTCTGGGCAA GATAGTGCTG AAGATTGTGT AG

Protein sequence

MKAILMNAPG APEVLTPADV PMPDLAGAFD VRVKLHAAGV NPIDTKVRKA NMYYPDRLPS 
ILGCDGAGVV EAVGSSVTRV RAGDEVFFFN NGLGGAPGNY AEYAVVHEDY LALKPGNLSM 
VEAAAVPLAL ITAWEALIKR GNLKGSQIAL IHAGAGGVGH IAIQLARYLK ARVATTISSE 
EKAAFVQSLG AELAIDYREN DFVDTALEWT EGLGVNLALD TVGGETFCKS FSAIRLYGRV 
VSLLSTVCDA KQLNTARLRN LSIGYVQMTA PLYFGLHSAR VVQTGILEQG ARLLEQGILK 
IHVSRTLPLT EAAEAHRLIE AGHTLGKIVL KIV