Gene Nmul_A1400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1400
Symbol
ID	3786430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1595520
End bp	1596560
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	637811488
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_412095
Protein GI	82702529
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAGA TTCTCGGATT CGCCGCGCAC GCCCCCGGGC AGAAACTCGA ACCATTCACT 
TATGACGCCG GGCCTCTCGC GCCGGAGGAA GTGGAAATTG CGGTGGAGCA TTGTGGTCTT 
TGTCATTCCG ATCTTTCAAT ACTGAATAAT GACTGGGGTA TCACGCAGTA TCCCGTTATT 
CCGGGGCACG AAGCCATTGG CCGGATTGTC GCGATGGGAG AACAGGCAAA GGGATTGCAA 
ATCGGCCAGC GGGTAGGCGT TGGCTGGAAT GCGGGCAGCT GCATGCACTG CCATGAATGC 
ATGAGCGGCG ATCACAACCT TTGTACCAGA GCCACCGCGA CAATCATCGG GCATTACGGG 
GGATTTGCCG ACAAAGTGCG AGCCCACTGG GCGTGGACGA TTCCCATACC TGAGACCCTT 
GAAAGTTCCT CCGCAGGCCC GTTACTTTGC GGAGGAATTA CTGTATTTGC GCCCCTTGCG 
GCCTATGTAA AACCGACCGA TCATGTAGGT GTCGTTGGCA TTGGCGGCCT TGGTCATCTC 
GCCCTGCAAT TTGCGCATGC CTGGGGTTGC GAAGTTACGG CCTTCTCTTC CAATCCCTCA 
AAGGCGGAAG AAATGCGCAC CCTCGGTGCC CATCGTGTTC TCTCCAGTCG TAAGAGCGGC 
GAAATTCGCT CGGCAGCACG CTCGCTCGAC TTTCTGCTGG TGACCGTCAA TGTCCCCCTT 
GACTGGGCAT TGCTGCTCCA GACGCTGAAA CCGAAGGGAC GCATGCATCT CGTTGGCGCA 
GTGCTCGAAC CCCTGCCTAT CCCCGCTTTC GAGCTTCTGA GCGGACAGAA GAATGTTTCA 
GGGTCACCGA CGGGTGGGCC TGCGATGATG GCGGATATGC TGGATTTTGC CGCCCGTCAC 
GGCATTCAGC CTCAGGTAGA GCGTTTTCCC ATGAGCAGGG TCAATGAAGC GGTTGCACAT 
CTGGCTGCTG GAAAAGCGCG CTACCGCATA GTCCTGGATG CGAATTTCAA TCGGGAGCAC 
CCAGGAAGTG CGAATGCATG A

Protein sequence

MTKILGFAAH APGQKLEPFT YDAGPLAPEE VEIAVEHCGL CHSDLSILNN DWGITQYPVI 
PGHEAIGRIV AMGEQAKGLQ IGQRVGVGWN AGSCMHCHEC MSGDHNLCTR ATATIIGHYG 
GFADKVRAHW AWTIPIPETL ESSSAGPLLC GGITVFAPLA AYVKPTDHVG VVGIGGLGHL 
ALQFAHAWGC EVTAFSSNPS KAEEMRTLGA HRVLSSRKSG EIRSAARSLD FLLVTVNVPL 
DWALLLQTLK PKGRMHLVGA VLEPLPIPAF ELLSGQKNVS GSPTGGPAMM ADMLDFAARH 
GIQPQVERFP MSRVNEAVAH LAAGKARYRI VLDANFNREH PGSANA