Gene Nmul_A1473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1473
Symbol
ID	3785447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1681942
End bp	1683048
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	56%
IMG OID	637811561
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_412168
Protein GI	82702602
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.420949
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGAGA TTCGGGCAGC GACGATTCGA CAGAAGGGTG GGCCTTTCAG GATCGAGAAT 
TTGATTCTGG ATGAGCCACG CCCAGATGAG GTGCTGGTTC GTATCGCGGC TACTGGCATG 
TGTCATACCG ACATGGTAGC GCGTGATCAG CTCTATGATG TCCCCTTACC GATTGTGCTT 
GGGCATGAAG GTGCGGGTGT TGTCGAACGG GTAGGCAGCA ACGTGAAAAA AGTGACGGCA 
GGAGATCACG TAGTGCTGAC CTATATGTGG TGCGGCCATT GCAGGCCATG TCTCCATGGA 
GATTTAACCT ATTGCCAGAA TTTCTATGCA CTGAATTTTG GCGGCGCCAG GGAAGACGGC 
AGCAGCTCCG CCCGCGATGC GCATGGTTCG CTTCATGACC ATTTCTTCGG CCAGTCGTCA 
TTCGGGACTT TTGCTCTTAC CCACGAACGT AATGCGATCA AGGTGCCGAG GGAAGCTCCG 
CTGGAGCTTC TTGGTCCGCT TGGCTGCGGC ATTCAAACTG GCGCCGGTGC AGTGATAAAT 
GCGCTTAAAG TCAATCCAGG CGCCAGTTTT GCGGCTTTTG GCGGGGGAGC GGTAGGACTG 
AGTGCGGTAA TGGCGGCTCG CGTCACGGGC GCCACAACGA TTATTGCTGT GGATGTCGTT 
CCATCCCGGC TCGAGCTGGC GAGAGAGCTC GGGGCAACTC ACACGGTTAA CAGCCGCGAA 
ACCGATCCCG TCGCGACGGT GCGCAAGATC AGTGGCGGGG GGGTAGAATA TGCCCTTGAG 
TCCAGTGGTC GGCCCCAGGT ATTGCGCCAG GCCATCGATG CGCTGGGCAT TCGCGGCACT 
TGCGGCATTG TCGGCGCGCC CGCTCTTGGG ACAGAGGTCA GCTTTGACGT GAATGGCGTA 
ATGACCACCG GCAAACGCAT CCTTGGGATC ATCGAAGGCG ATAGCATACC CGACCTCTTC 
ATACCAGCCC TTGTCGAGCT TTACATGCAG GGACGCTTTC CATTCGACAA GCTCGTGAAG 
TTTTACCCTC TTGACAGGAT CAATGAAGCG GCAGAGGATA GTGAGAAGGG TATTACCATC 
AAGCCGATTA TCAGGGTGGC ATTATAA

Protein sequence

MMEIRAATIR QKGGPFRIEN LILDEPRPDE VLVRIAATGM CHTDMVARDQ LYDVPLPIVL 
GHEGAGVVER VGSNVKKVTA GDHVVLTYMW CGHCRPCLHG DLTYCQNFYA LNFGGAREDG 
SSSARDAHGS LHDHFFGQSS FGTFALTHER NAIKVPREAP LELLGPLGCG IQTGAGAVIN 
ALKVNPGASF AAFGGGAVGL SAVMAARVTG ATTIIAVDVV PSRLELAREL GATHTVNSRE 
TDPVATVRKI SGGGVEYALE SSGRPQVLRQ AIDALGIRGT CGIVGAPALG TEVSFDVNGV 
MTTGKRILGI IEGDSIPDLF IPALVELYMQ GRFPFDKLVK FYPLDRINEA AEDSEKGITI 
KPIIRVAL