Gene Nmul_A1371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1371
Symbol
ID	3786514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1557647
End bp	1558642
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	57%
IMG OID	637811459
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_412066
Protein GI	82702500
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR02824] putative NAD(P)H quinone oxidoreductase, PIG3 family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.544729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCAA TTGAAATACA ACATCCGGGA GGGCCGGAGG TGCTGAGGCC TGCATTCCAT 
CCGGTTCCCC AGCCCGGCCC TGGTGAAATT CTGATCAAAG TGGCAACGGT CGGAGTAAAT 
CGGCCCGATA TCCTGCAGCG CCGGGGCCTT TACCCTCCCC CTCCGGGCGC CTCGGAAATC 
CCGGGACTGG AAGTCGCGGG GGAAATCGTT GAATCAGGCG AAGGCACAAT CCGATTCAGG 
CCGGGCGAAA AGGTTTGCGC GCTGGTGGCG GGCGGTGGCT ATGCCGAATA CTGCGCCGTG 
CACGAAAGCA ATGCCCTGCC GATACCATCA GGTCTCGGCA TGATCGAGGC AGCGGCATTG 
CCGGAAACCT TTTTTACCGT TTGGACCAAC CTGTTCCAGC GCGGCAAGCT AAAATCGGGC 
GAGACTGTAC TCATTCATGG TGGCACTTCG GGCATCGGCA CCACCGCCAC AATGCTGGCC 
AAGGCTTTCG GCGCTCTTGT CCTGACAACC GCAGGCTCGG AGGAAAAATG CCGGGCATGC 
GTTGCTCTGG GCGCTGATTT TGCCATCAAT TACCGCACCC AGGATTTCGT CGAGGAAGTC 
CGGAAGTTTA CGGATGGCAA AGGAGTCGAT GTCATTCTCG ATGTTGTCGC CGGGGACTAC 
GTGGCGAGAA ACTACAAGGC GGCTGCGCTC AATGGCCGTA TTCTCCAGGT CGGCATCCAG 
AATGGGCCTG CCATGGAACT GAACCTGATG CCCATGCTGG CAAAAAGGCT GACTCATACC 
GGGTCGACCC TGCGATCGCG CACGGTGCCT GAAAAGGCCC AGATTGCCCA GGAACTGGAG 
CAGCAGGTCT GGCCATTATT GCATGAGGGA AAAATAAAAC CGCAAATATT CAAAACATTC 
CGACTGGAGG AAGCTGCCGA GGCGCATGTA TTGATGGAAT CAGGCGCCCA TATCGGAAAA 
ATCGTATTGA TGACAGGAGC AACTATCTCC GCTTGA

Protein sequence

MLAIEIQHPG GPEVLRPAFH PVPQPGPGEI LIKVATVGVN RPDILQRRGL YPPPPGASEI 
PGLEVAGEIV ESGEGTIRFR PGEKVCALVA GGGYAEYCAV HESNALPIPS GLGMIEAAAL 
PETFFTVWTN LFQRGKLKSG ETVLIHGGTS GIGTTATMLA KAFGALVLTT AGSEEKCRAC 
VALGADFAIN YRTQDFVEEV RKFTDGKGVD VILDVVAGDY VARNYKAAAL NGRILQVGIQ 
NGPAMELNLM PMLAKRLTHT GSTLRSRTVP EKAQIAQELE QQVWPLLHEG KIKPQIFKTF 
RLEEAAEAHV LMESGAHIGK IVLMTGATIS A