Gene Nmar_1700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1700
Symbol
ID	5774600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	1560670
End bp	1561704
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	35%
IMG OID	641317354
Product	H(+)-transporting two-sector ATPase
Protein accession	YP_001583034
Protein GI	161529208
COG category	[C] Energy production and conversion
COG ID	[COG1527] Archaeal/vacuolar-type H+-ATPase subunit C
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.122412
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAGA ACGTCTATGC ATCAGTAAAG TCATACAGCC AAAGAGGAAA ATTACTCAGT 
AGGGCTGATT TTCAGACACT GGCAGAATCA AGAGATCTTG ATGAATTTAT GACCAGAATA 
AAGAACACCA TTTATGGTGA TTCAATTAAT GATGTTCAAA AACCATATAC TTCACAAGGT 
ATTGAATCAG CATTTAGAGG ACATTTGGCT GATGTCCATT ACTCCATTGC AAAAACTGCT 
GGCGATTCTG ATATTCTTGA TGCATATTAT ATGAAGTTCA TAATTTCAAA TCTAAAATTA 
ATACTAAAAG GCAAGGTTTT AGGTAAATCA CAAGAAGAGA TTGAGAATCA CATCAATCTA 
CGTGCAGAAG AATTAGTTAA ACAACGAGAT ATCATAATCA AATCCCTTGT TGCAAAAGAT 
CTTGAAGAGG CAGTTGCAAG TCTAAATTCA GTTCAATTTG GAGATGAGAT TGCAAAGGCT 
GCAACACTTT ACAACGAAAC AAAAAACATC CAAGTCTTTG ACACGTATTT TGATAAAATT 
TTGTACCAAC AACTAGGACG AGCTTTGAAG AATACAAGAG ATAGAGATGT CATAAAGATT 
GTCGGAATGG ATGTTGACTT TTACAATCTT CTTAGTGTGA TTAGAGGAAA ATTCTGGGGA 
TTAGAAGAAT CACAAATTCA AGATTTGATT GTGACTCAAA CTCCAACTGT CCCAAGAGAA 
CTTCTTGGAA GAATGATGGC AGCAGGTTCA GTCAGAGATG CACTAAATGA GCTTGCCACA 
ACCAAATACA AAGACATGAT TCCACAGATG GAAAATGAGT TAGATGCAGT TGCCGAATTT 
GAAAGAGCAT TTGAGATGAG CATTTATCAT TCATCTGCCA GAGCATTTAC CAAGATGTTT 
AGTTTTGCAA CAATCATAGG AATCACAAAA CTAACGGGCT TTGAAGTAAG GAATTTGGCT 
GCAATTGCAT ATGCAGTAGA GCAAAAAATT CCTACAGAAA CAACAATGTC AAAATTGATT 
CTTGAAGAAG AATAG

Protein sequence

MGKNVYASVK SYSQRGKLLS RADFQTLAES RDLDEFMTRI KNTIYGDSIN DVQKPYTSQG 
IESAFRGHLA DVHYSIAKTA GDSDILDAYY MKFIISNLKL ILKGKVLGKS QEEIENHINL 
RAEELVKQRD IIIKSLVAKD LEEAVASLNS VQFGDEIAKA ATLYNETKNI QVFDTYFDKI 
LYQQLGRALK NTRDRDVIKI VGMDVDFYNL LSVIRGKFWG LEESQIQDLI VTQTPTVPRE 
LLGRMMAAGS VRDALNELAT TKYKDMIPQM ENELDAVAEF ERAFEMSIYH SSARAFTKMF 
SFATIIGITK LTGFEVRNLA AIAYAVEQKI PTETTMSKLI LEEE