Gene Nmar_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1565
Symbol
ID	5774126
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1433386
End bp	1434471
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	37%
IMG OID	641317218
Product	alcohol dehydrogenase
Protein accession	YP_001582899
Protein GI	161529073
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TCATGAAGGC TCTAGTTTAT GAAGAATATA CTACTGATGA TGATTTTTCT 
AAAATTTTAA AAATTAAAGA TCTGCCAATT CCTGAACCAA AATCAAACGA AGTAGTTTTC 
AAAGTAAAGG CAGCCGCATT AAATTATGAT GATATTTGGG GAATGAGAGG CAAACCTCTT 
GCAATTCCTT TACCTCATAT TTCTGGAACT GATGCCGCAG GTGAAGTAAC TGCAGTAGGT 
GAAGATGTAA AAAATTTCAA AGTAGGTGAT AGAGTGGTTT CACATGGAAA CATGTCTTGT 
AGGGTGTGTA AGAGATGTAC ATCCGGACGC GAATATGATT GTAAAAAACG AACCATTTGG 
GGATTTGAAA CAGGTCCTCT TTGGGGAGGA TACTGTGAAT ATACTCATCT TCCAGAAGTC 
AATGTTGTAA AAATCCCTGA AGGAATATCA TATGAAGAAG CAGCAGCTGC ATCTATGACC 
ATGTTAACTT CTTGGCATAT GTTAGTTGGC AGAGCAAAAA TTCAACCTGG ACAATTAGTT 
TTGATCATGG GCGGAGGTTC TGGTGTTGGA AATTATGGAA TTCAGATTGC AAAACTTTTT 
GGTTGTACTG TAATTGCAAC TGCTAGTCCT GATAAATTAG ATCAACTACT TGAACTTGGA 
GCAGACTATG CAATTGATCA TAGAAAAGAA GACTGGCATA AAGAAGTAAG AGCAATTGCA 
AAAAAACTTC CAAAACCATT TGGGGAGGTT CCTGGTGTAG ATGTAATTTT TGAACATATT 
GGAGGCTCTC ATTGGAACAA AGAACTCACT CTTCTAAACT ATGGAGGCAC TGTGATTACT 
ACTGGTGCGA CTACTGGTTA TATGGCAAAA ACTGATCTTA GACATATTTT CTTTAAAGGA 
CTAAACATTT TGGGTTCAAC TCAGGGAACA AGAGCTGAGC TTGAAGAGGG ATTTTATTGG 
ATGTCTAAAG GAAAAATAAA ATCCATAATT GATTCTGAAT ATACGCTTGA GCAAGCTGCT 
GAAGCCCATA CAAAGATGCT AAAAGGTAAA GGACTTTTTG GAAAAATCAT TATGAAACCA 
AACTGA

Protein sequence

MKKIMKALVY EEYTTDDDFS KILKIKDLPI PEPKSNEVVF KVKAAALNYD DIWGMRGKPL 
AIPLPHISGT DAAGEVTAVG EDVKNFKVGD RVVSHGNMSC RVCKRCTSGR EYDCKKRTIW 
GFETGPLWGG YCEYTHLPEV NVVKIPEGIS YEEAAAASMT MLTSWHMLVG RAKIQPGQLV 
LIMGGGSGVG NYGIQIAKLF GCTVIATASP DKLDQLLELG ADYAIDHRKE DWHKEVRAIA 
KKLPKPFGEV PGVDVIFEHI GGSHWNKELT LLNYGGTVIT TGATTGYMAK TDLRHIFFKG 
LNILGSTQGT RAELEEGFYW MSKGKIKSII DSEYTLEQAA EAHTKMLKGK GLFGKIIMKP 
N