Gene Nmar_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1079
Symbol
ID	5774107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	983428
End bp	984456
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	36%
IMG OID	641316721
Product	alcohol dehydrogenase
Protein accession	YP_001582413
Protein GI	161528587
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTG CATCTGTTAA AGAACCATCA GTTATCTCTG TAAGTGAAAC AGAAAATCCT 
TCTTTGGAGT CTGGTGAAAT TTTAGTTCAG ATGCATGCAT GTGGAATATG TGGCTCTGAT 
TTGGAAAAAG TATTTGGACA ATATGGACAA CCATCAATGC GTCTAGGCCA TGAACCTGCT 
GGTATTGTTT TAGATGTTGG TTCTGGTGTA ACTGAATTCA AAAAAGGTGA CAGAATATTT 
ACTCACCATC ATGTTCCTTG TTATGATTGT CATTTTTGTA ATCATGGAAA CGAGACAATG 
TGCAAAAAAT ACTATGAAAC TAATCTGTCT CCCTGTGGTT TATCTGAGCA ATATGTTGTT 
CCTGCATGGA ATGTTTCTCA TGGTGGAGTT TTGAAAATAT CTGATTCTCT TAGTTTTGAA 
GAAGCTGCGA TGATTGAACC ACTTGCATGT TGTGTTCGGG CCTGGACAAA ATACCATTAT 
CAGGAAGGAG ACAGTGCTGC AATCTTTGGA GTTGGTCCTA CTGGAATGAT GCATGTGATG 
CTTGCTCAGG CAAAGAAATT CTCCAAAATC TTCTGTTTTG ATGTTAATGA TTTTAGATTG 
GACTTTGCAA AAAAATTCAA CATTACAGAA TCCATCAACT CTATGGATGA AACTAAGAAA 
CAGAAAATCT TAGAGCATAC TGACAACCAA GGAGTTGATG TTGCTATTGT TGCAACTAGC 
AGTCTCAAAG CTCTTGATGA TGCAATTGAT ATGGTTAGAA AAGGCGGTGC TATAATGATG 
TTTGGAGTTC CTTCAAAAGG TGCAAAAATG GATTTAGACA TGAGTAAAAT CTATTCAAAA 
GAAATCACTC TTGTTACTAG TTATGCTGCA TCTGATAATG ATACAAAAGA AGCATTGAAT 
CTAATCGAAT CATTACAAAT TGATGTCAAA CAGTTAATCA CACACACTTA TCCAATTGAT 
GATACTCAAA AGGCATTTGA TCATGCACGA AGTGGTGACA ATGCAATGAA AATAATCATT 
ACAAAATAA

Protein sequence

MKTASVKEPS VISVSETENP SLESGEILVQ MHACGICGSD LEKVFGQYGQ PSMRLGHEPA 
GIVLDVGSGV TEFKKGDRIF THHHVPCYDC HFCNHGNETM CKKYYETNLS PCGLSEQYVV 
PAWNVSHGGV LKISDSLSFE EAAMIEPLAC CVRAWTKYHY QEGDSAAIFG VGPTGMMHVM 
LAQAKKFSKI FCFDVNDFRL DFAKKFNITE SINSMDETKK QKILEHTDNQ GVDVAIVATS 
SLKALDDAID MVRKGGAIMM FGVPSKGAKM DLDMSKIYSK EITLVTSYAA SDNDTKEALN 
LIESLQIDVK QLITHTYPID DTQKAFDHAR SGDNAMKIII TK