Gene Nmar_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1054
Symbol
ID	5773538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	928142
End bp	929959
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	35%
IMG OID	641316696
Product	ATPase
Protein accession	YP_001582388
Protein GI	161528562
COG category	[R] General function prediction only
COG ID	[COG1855] ATPase (PilT family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAAAA TTGTAGTTGA TACCAGTGTT ATAATTAATG GTCAATTAAT ATCTCAAATA 
GAAAAAGGAT CTGTTAAAAA CTCCCAAATC ATCATTCCTC AAGCAGTATT AGACGAATTA 
CAATCACAAG CATCAAATAA AAAAGAGCAG GGATTTGTGG GGTTAGAAAA AATTCGTAAA 
CTAAAAGATC TTTCTGGCAG TTTTGGTTTA GAAGTAATCC AAAAAGGCAC CCATCTGTCT 
TCTGATGAAA TTAAACTTGC CGGAGGTGGA AGAATTGATG CTTTAATTGC GGATATGGCA 
AAACAAAACA ATGCTACCCT TTACACATCT GATCATGTTC AGCATTTAGT TGCACAAGCA 
GAAGGAATTC AAACTGTATT TTTGAAAACA GAGATCCCTA AAGAAACTTT GGAATTTCTA 
AAGTTTTTTG ATGCTGAAAC AATGAGTGTC CATCTAAAAG AAAACCAACA TCCACTTGCT 
AAACGCGGTA AACCTGGTGC CTTTTTACTT ACAAAAATCA GCGATGATAT TCTTTCACGA 
GAGTATCTGG AAATGATTTC TTCTCAAATT CTAGATATTG CAAATGCAAA TGATTCTGGC 
ACTATTGAAA TATCAAAAAC AGGTGCTTCA GTAGTACAGC ATGAAGACTA TCGAATCGCA 
ATTACTCATC CTCCATTCTC TGAATCTTTT GAGATAACAA TAGTTCATCC AATAATCCAA 
ATGTCTCTTG AAGATTATGA TATCTCTGAA AAACTAATGG AGCGATTCTC TGATAGGGCA 
GAAGGAATTG TAATTTCAGG TGCTCCTGGT TCTGGAAAAA GTACTTTGGC TTCAGGACTA 
GCAAATTTTT ATCATAACAA GGGAAAGATT GTAAAAACAT TCGAATCTCC TCGTGACTTG 
CAAGTTGATC CTGGTATTAC TCAATACAGT AAGCTTGATG GGAGTTTTGA TAATACTGCT 
GATATCTTGC TCTTAGTTCG TCCAGATTAT ACTGTCTTTG ATGAGGTAAG GAGACGCGAA 
GATTTCAGAA CCTTTGCTGA TTTGAGATTG ACTGGAGTTG GGATGGTGGG AGTAGTTCAT 
GCAAATTCTC CTTTAGATGC AATTCAAAGA TTCATTGGAA AGATTGAGCT TGGAATTATT 
CCAAATGTTT TGGATACTGT CGTGTTTGTT AAAGATGGAC AAATCAAAAA AGTCTATGAT 
TTAGAATTAA AGGTAAAGGT ACCTTCTGGA ATGACTGAGT CTGATCTTGC TAGACCTGTT 
ATTGAAATTC GTGATTTTGC TGATAATACG TTGGAGCATG AAATCTATAC ATTTGGAGAG 
GAAAATGTGA TAGTTCCTGT AGGGAAAAAA ACCAAAGTAG GAATTGAAAA ACTAGCTGAA 
GAGAAAATTC GTGAGACATT CAAAAAGTAT GATCCTAGAG CACAAGTTGA GATTCTATCT 
GATAACAGAG TTAAGGTGAT GGTTGATGAA CAATACATAC CATCAATCAT TGGTAGAGGA 
GGTTCTAACA TTAATGAAAT CGAAAAATCC CTTCAAGTAC ATGTTGATGT GGTTCAAAAA 
GACTCTGAAC ACTATAATTT AGACTCCAAC GATTTGCCTT TTACTTTTTC AGAATCAAAA 
ACAGCTCTAA TCCTCACTGT TAGTAAAGAG TACACTTCAA TGCATGCAGA CGTTTATGTT 
CGTGATGAAT ACATTACATC AACTAGGATT GGTAAAAAGG GACAAATCAA AATTCCAAAA 
CGCTCTGATG TTGCAAGGAC CTTGATGAAA CTAGCTTCAT CCCAAAACGA TATTCAATTA 
TTTCTCAAAG ATTTTTGA

Protein sequence

MSKIVVDTSV IINGQLISQI EKGSVKNSQI IIPQAVLDEL QSQASNKKEQ GFVGLEKIRK 
LKDLSGSFGL EVIQKGTHLS SDEIKLAGGG RIDALIADMA KQNNATLYTS DHVQHLVAQA 
EGIQTVFLKT EIPKETLEFL KFFDAETMSV HLKENQHPLA KRGKPGAFLL TKISDDILSR 
EYLEMISSQI LDIANANDSG TIEISKTGAS VVQHEDYRIA ITHPPFSESF EITIVHPIIQ 
MSLEDYDISE KLMERFSDRA EGIVISGAPG SGKSTLASGL ANFYHNKGKI VKTFESPRDL 
QVDPGITQYS KLDGSFDNTA DILLLVRPDY TVFDEVRRRE DFRTFADLRL TGVGMVGVVH 
ANSPLDAIQR FIGKIELGII PNVLDTVVFV KDGQIKKVYD LELKVKVPSG MTESDLARPV 
IEIRDFADNT LEHEIYTFGE ENVIVPVGKK TKVGIEKLAE EKIRETFKKY DPRAQVEILS 
DNRVKVMVDE QYIPSIIGRG GSNINEIEKS LQVHVDVVQK DSEHYNLDSN DLPFTFSESK 
TALILTVSKE YTSMHADVYV RDEYITSTRI GKKGQIKIPK RSDVARTLMK LASSQNDIQL 
FLKDF