Gene Nmar_0523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0523
Symbol
ID	5773307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	466837
End bp	467889
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	37%
IMG OID	641316156
Product	alcohol dehydrogenase
Protein accession	YP_001581857
Protein GI	161528031
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCG CCAAAATCCC AGGTCCAAAT GAACCTCTAA CAATATCTGA AACTGAAAAC 
CCAAAACCAT CTGGAACCCA GGTATTACTT AAAGTAAAAT CTGAAGGTGT CTGTCATAGT 
GATTTGCATC TGTGGGAAGG TGGATATGAC CTTGGAGATG GTCAATTTTT GAAAGTAACT 
GATCGTGGTG TAAAATACCC TGTAACGCCT GGACATGAAA TTGTTGGAAC TATTGAAGAG 
ATTGGAGAAA ATGTTTCAAA TGTAACTGTA GGTGATGATG TTCTAGTTTT TCCTTGGATG 
GGCTGTGGTG AATGCCCTGC ATGTAAAGTT GGTAATGAAA ATCTATGTGA TGCTCCAAAA 
TCGATGGGGC TTTTCCAAAA TGGTGGTTAT GCTGATTATG TTTTAGTTCC GAATTCTAAA 
TATTTAGCAA AACTTGATGG TGTTGATCCT GATGCTGCAA CTTCACTTGC ATGTTCTGGA 
TTAACTGCAT ACACTGCTAT CAAAAAAGCA AATCAAAATT CTCCAGAATT CATTGTAATT 
GTAGGAGCTG GTGGATTGGG ATTGATGGGA GTTCAAATTG CTAGTGAGAT TACTAATGCA 
AAAATCATTT GTGTTGATTT AGATGATGCA AAATTAGCAA CGGCAAAAGA AATGGGTGCT 
CATTTTACTG TAAATTCTAA AGATTCTGAA ACTGTTCAAA AAATAATGTC AATATGTAAT 
GATAAGGGTG CAGATAGTGT TGTTGACTTT GTTAATGCTC CACCAACTGT AAAGACTGGC 
TTAGCAGTGT TAAGAAAAAG AGGAAATCTT GTTCTAGTTG GATTATTTGG TGGCTCACTA 
GAATTGTCTC TCGTTACAAT TCCTCTAAAA TCAATTACCA TTCAAGGTGC ATACACTGGA 
AATTACAATG ACATGGTTGA ACTACTTGGA CTTGCAAGAA AAGGAACCAT AAACCCAGTT 
ATTTCAAAAA GATATTCTCT TGATGAAGCA AATTCTGCAT TACAGGATCT TAAAGATCGT 
AAAATCCTTG GACGTGCAGT CATCAATCCA TGA

Protein sequence

MKSAKIPGPN EPLTISETEN PKPSGTQVLL KVKSEGVCHS DLHLWEGGYD LGDGQFLKVT 
DRGVKYPVTP GHEIVGTIEE IGENVSNVTV GDDVLVFPWM GCGECPACKV GNENLCDAPK 
SMGLFQNGGY ADYVLVPNSK YLAKLDGVDP DAATSLACSG LTAYTAIKKA NQNSPEFIVI 
VGAGGLGLMG VQIASEITNA KIICVDLDDA KLATAKEMGA HFTVNSKDSE TVQKIMSICN 
DKGADSVVDF VNAPPTVKTG LAVLRKRGNL VLVGLFGGSL ELSLVTIPLK SITIQGAYTG 
NYNDMVELLG LARKGTINPV ISKRYSLDEA NSALQDLKDR KILGRAVINP