Gene Nmar_0944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0944
Symbol
ID	5773424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	821861
End bp	823369
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	34%
IMG OID	641316583
Product	DEAD/DEAH box helicase domain-containing protein
Protein accession	YP_001582278
Protein GI	161528452
COG category	[L] Replication, recombination and repair
COG ID	[COG1111] ERCC4-like helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.219014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACTGAAT TTATTGAAAA AAGATATGTC AAAAAAGACT CTATTGAAAA GCGAGATTAC 
CAAGTAAACC TTGCAAATCA GGCTATCTCT GAAAATTGTA TTGTAGTTTT GCCAACTGGT 
CTTGGAAAAA CTGCAATTGC ATTACAAGTT ATTGCGGAAT ATCTCTCCAA AGGTACTGGC 
GGTGCATTGT TTTTAGCACC TACAAGAGTA CTTGTAAACC AACATTATGA ATTTCTAAAA 
GAGAATCTAA CATTAGATGA CATTTCTCTA ATAACTGGTG AGGATACTAT TCAAAAAAGA 
ACCAAACTTT GGAATAACAG TGTAATTTGC GCCACTCCTG AAATTGCAAA AAATGATTTG 
GATAGGGGAA TTGTTTCGTC TAACCAATTT AATCTCATAA TATTTGATGA AGTACATAGA 
ACAGTTGGAG ATTATGCATA TTCTGGAATC GCAGAACGTT TTGTTAATTC TGATGGAAGA 
ATTGTTGGAA TGACTGCAAC ATTGCCTAGT GAAAAAGACA AGGCAACTGA AATTTTAACT 
AAATTAAAAA TTGCAAGTGT TGCTGAAAGA ACAGAAAATA GTCCTGATGT CAAACCATAT 
ACTCAGGAGA CCAACACTGA ATGGATAAAT GTTGAACTCC CACCAGAACT AAAAACAATT 
CAAACATTAT TGAAATTAGC CCTTGATCAA AGATATCAAA CATTACGTGA TAATGGAATC 
AAACTAGCTG AACAACAATC ACTTTCTGCT CTATTAAGAA TTAGACAATT TGTATTAAAT 
CAGAATAGAC GTTCTGCAAA ACCACTATTC ACTGCAATTA GAATTCACTA TGCACTAAAC 
ATCTTAGAGG CACATGGAAT TACGCCGTTT TTGAAGTTCT GTGAGCGTGC CAAGGCAAAA 
AAAGGTGCAG GAGTAAAGGA ACTCTTTGAG GTTGACCCAA ATTTTACTCG TGCAGTACAT 
CTTGCAAAAG AAGCTCAATC TAGGGGAATT GAACATTCTA AGATTCCTAA ACTAAAAGAT 
ATCATAGAAT CTGTACCTGG AAAGGCTTTG ATTTTTACAA GCTATCGTGA TTCTGTTGAT 
TTAATTCATA GTAAATTGAC TGAACTTGGA GTTTCTGCGG GAATTCTGAT TGGTAAAGCA 
GGTGAAACCG GCCTAAAACA AAAAAAGCAA ATTGAAATTG TACAAAAGTT TCGTGATGGT 
ATCTTTGATG TTTTAATTGC AACTCGTGTT GGTGAAGAAG GGTTGGATAT TGCTGAAGTA 
AACCAAGTTA TCTTTTATGA TAATGTTCCT AGCTCTGTTA GATTTATTCA AAGACGAGGT 
AGAACTGGAA GAAAAGATAC TGGAAAACTA GTTGTTCTAA TTGCAAAAAA TACTATTGAT 
GAGACATACT ATTGGATTGG TAAACGAAAA ATGTCTGCAT CAAAAGCAAT GGGTGATAAA 
ATGACTAAGG TATTGGAAAA AAATCAAGAA GTTGTTTCTA AAAAGACAGG ATTAGATGCG 
TTTATCTAA

Protein sequence

MTEFIEKRYV KKDSIEKRDY QVNLANQAIS ENCIVVLPTG LGKTAIALQV IAEYLSKGTG 
GALFLAPTRV LVNQHYEFLK ENLTLDDISL ITGEDTIQKR TKLWNNSVIC ATPEIAKNDL 
DRGIVSSNQF NLIIFDEVHR TVGDYAYSGI AERFVNSDGR IVGMTATLPS EKDKATEILT 
KLKIASVAER TENSPDVKPY TQETNTEWIN VELPPELKTI QTLLKLALDQ RYQTLRDNGI 
KLAEQQSLSA LLRIRQFVLN QNRRSAKPLF TAIRIHYALN ILEAHGITPF LKFCERAKAK 
KGAGVKELFE VDPNFTRAVH LAKEAQSRGI EHSKIPKLKD IIESVPGKAL IFTSYRDSVD 
LIHSKLTELG VSAGILIGKA GETGLKQKKQ IEIVQKFRDG IFDVLIATRV GEEGLDIAEV 
NQVIFYDNVP SSVRFIQRRG RTGRKDTGKL VVLIAKNTID ETYYWIGKRK MSASKAMGDK 
MTKVLEKNQE VVSKKTGLDA FI