Gene Nmul_A1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1937
Symbol
ID	3784233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2227666
End bp	2228700
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	57%
IMG OID	637812023
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_412624
Protein GI	82703058
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.601892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCATGC AAAACCAAGA TGGCTTGATG CAGGCAATGG TGCTGGATGC GCCCCGAGAA 
AAGGTTCAAG TGCGCCGTAT CCCGCGCCCC CGGCCGGGTC CTGATCAGTT ATTGATCGAG 
ATTGCAGCGT GTGCAGTCTG CCGCACCGAC CTGCACGTAG TGGACGGTGA ACTGCCTCAT 
CCGAAACTGC CTATTATCCC GGGGCATGAA ATCGTTGGAC GCGTAATTGC ACGCGGAGCG 
GATGTTCGGG ATTTCGCAGT GGGAGACAGG ATCGGTATTC CCTGGCTGGG CTGGACATGC 
GGTCATTGCC GCTATTGTCT CGAGGGACGG GAAAACCTGT GCCCGAATGC CAGATTCACC 
GGTTATCAGA TCGACGGCGG TTACGCGGAA TATACGGTCG CAGACGCCCG CTATTGTTTT 
CGCATTCCGG ACCGTTATAG CGACCTGGAA GCTGCCCCGC TGCTGTGCGC CGGATTGATC 
GGCTACCGCG CGCTCAAGAT GACCGGCAAT GCCGAACGGG TAGGTATCTA CGGCTTTGGC 
GCCGCCGCCC ACATTGTCGC TCAAATTCTG CATTATCAAG GGTGCAGACT TTTTGCATTT 
ACACGCCCCG GTGATGCGGC CGCCCAGGAA TTCGCCCACA AGATGGGCGC AGACTGGGTG 
GGCAGTTCGG ATACGATGCC CCCGGAAGAA CTCGATGCGG CGATCATCTT CGCTCCGGCA 
GGAGCTCTTG TGCCTATCGC TCTGCGCGCT GTTTGTCCCG GTGGAATCGT CGTCTGCGGA 
GGAATTCACA TGAGTGACAT TCCCGCTTTT CCTTATGACA TCCTGTGGCG GGAAAAACGT 
CTGGTTTCCG TTGCCAATCT TACCCGTCAG GATGGTGAGG AATTTTTAAA GCTGGCAGCG 
CAAGTGCCAA TCCACGTGAC TACGGAATCC TTTCCGCTCG GCGAAGCGAA TACGGCTTTG 
ACAAGATTGC GGGAAGGAAA GCTGACAGGC GCGGCAGTGC TCATTCCGAA AAAAGGGAAC 
GTTTCCCTCC CCTGA

Protein sequence

MAMQNQDGLM QAMVLDAPRE KVQVRRIPRP RPGPDQLLIE IAACAVCRTD LHVVDGELPH 
PKLPIIPGHE IVGRVIARGA DVRDFAVGDR IGIPWLGWTC GHCRYCLEGR ENLCPNARFT 
GYQIDGGYAE YTVADARYCF RIPDRYSDLE AAPLLCAGLI GYRALKMTGN AERVGIYGFG 
AAAHIVAQIL HYQGCRLFAF TRPGDAAAQE FAHKMGADWV GSSDTMPPEE LDAAIIFAPA 
GALVPIALRA VCPGGIVVCG GIHMSDIPAF PYDILWREKR LVSVANLTRQ DGEEFLKLAA 
QVPIHVTTES FPLGEANTAL TRLREGKLTG AAVLIPKKGN VSLP