Gene Nmar_1622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1622
Symbol
ID	5773044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1477386
End bp	1478462
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	40%
IMG OID	641317275
Product	alcohol dehydrogenase
Protein accession	YP_001582956
Protein GI	161529130
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAG TCGTATACAA TGAATATGCA CCAGATGATA ATTACGCTAA GATCCTTAAA 
GTCCAGGATA TAGACGAACC AAAACCAAAA GCAGATGAGG TAATTTTTAC CAATAAAGCA 
TCTGCCCTAA ATTATAATGA TATTTGGGGG ATGAGAGGAG TTCCAGTAGC AGTTCCTCTT 
CCACATGTTT CAGGTTCTGA TGTAGCTGGA GATGTTATCG CCGTAGGCGA AGATGTTAAA 
AATTTCAAAG TAGGTGACAG AGTTGTCTCT CACTCAAATC TTGCATGCAG AGTTTGTAGT 
GCATGTACTG ATGGAAGAGA ATTTGACTGT ACCCGAAGAC AAGTTTGGGG TTTCCAAACT 
GGACCACTAT GGGGTGCATA CTCTGAACAA ATACACTTAC CAGAAGTCAA TGTTTCAAAA 
ATTCCTGATG GAGTTTCATA TGAAGATGCA GCAGCAGCTT CAATGACAAT TCTTACCTCC 
TGGCACATGT TAGTTGGTAG AGCAAAGATT ACTCCAGGAC AAACAGTACT CGTAATGGGT 
GGTGGTTCTG GTGTCGGAAG CTTTGCAATT CAAATTGCTA AACTATACAA CTGTGATGTC 
ATTGCAACTG CAAGTCCTGA CAAATTAGAC AAATGTAAGG AACTTGGAGC AGATTATGCA 
GTAGACCACA GAAAAGACGA CTGGAGTAAA GAAGTCTTCA AAATTTCAAA AGAAATTGCA 
AAAACAAAAG GTGAAGCACC TGGAATTGAT CTTGCATTTG ATCACATTGG TCAAACTCAC 
TTCAACAAGC AACTAACATT GCTCAAGTAT GGTGCAACAC TAGTTTCATG TGGTGCAACA 
ACAGGTTATG ACGCACAAAT AGATCTTAGA CACATCTTCT TCAAAGGAAT CAATGTCTTA 
GGTTCAACAC AAGGAACTAA AGCTGAATTA GATCAAGGTC TATACTGGAT GGGTCAAGGA 
AAGATAAAAT CAATTGTTGA CTCTGTCTTT ACCTTCGAAC AAGCAGCAGA GGCTCATACA 
AAGATGCTAA AGGGTGACTT CTTTGGCAAA ATCATTATGA AGCCTGAAGG CGCTTAG

Protein sequence

MKAVVYNEYA PDDNYAKILK VQDIDEPKPK ADEVIFTNKA SALNYNDIWG MRGVPVAVPL 
PHVSGSDVAG DVIAVGEDVK NFKVGDRVVS HSNLACRVCS ACTDGREFDC TRRQVWGFQT 
GPLWGAYSEQ IHLPEVNVSK IPDGVSYEDA AAASMTILTS WHMLVGRAKI TPGQTVLVMG 
GGSGVGSFAI QIAKLYNCDV IATASPDKLD KCKELGADYA VDHRKDDWSK EVFKISKEIA 
KTKGEAPGID LAFDHIGQTH FNKQLTLLKY GATLVSCGAT TGYDAQIDLR HIFFKGINVL 
GSTQGTKAEL DQGLYWMGQG KIKSIVDSVF TFEQAAEAHT KMLKGDFFGK IIMKPEGA