Gene Nmar_1158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1158
Symbol
ID	5773209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1059089
End bp	1060267
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	35%
IMG OID	641316801
Product	hypothetical protein
Protein accession	YP_001582492
Protein GI	161528666
COG category	[R] General function prediction only
COG ID	[COG2110] Predicted phosphatase homologous to the C-terminal domain of histone macroH2A1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAAT TCAAAATTTA TACTCCTGAC TTGAGCCAAT ACCTTTTCTA CATTACACAT 
ATTGACAATA TTCCGTCCAT GCTGCAAAAT GGAATTCTCT CTCATGATCA AATTGTAAAA 
CAAAAACTCG AATACACTTC AATTTATGAC AGCGATATTG TTTCCAGTAG AAGAGAAAAA 
ACCGCTAATG GGAAAAGTCT TTGGTATTTT GCTAATCTGT ATTTCCAACC TCGAAATCCT 
ATGCTGTACC GTGTAACTAT GGAAAAATCT CCTGATTGCA TAGCTGTTGT CGCTGTTGAT 
AAAAAAATCC TTACTACTCC TAACACAATT ATCACTGACG GAAATGCTGC AAATGGTCCT 
ACACATTTCT ATCCTAATAC TGAATTCAAA ACTATTGAAC GACAAATTAA CAGAATTACT 
AGTTTACAGT GGTGGACAGA TAGTAATGCT ACTAAAAGAC AAATTATGGC TGAATGTCTA 
GTTCCAGAAC GAATTCCACC TGAATTCATT CGTGCAATTT ATGTTAGTAA TCATACTCTT 
GCAGACGAAA TACGAAATTC TATGTCTTCT AGCATTTCAA TAATTCCTGA ACCTTCTATG 
TTCTTCCAAC CTGTAAGACA AATTCCACTC ACTTCAAATC TTTCATTGGT AGAAGGAGAT 
TTGTTTTTCT CAAAAATGCA AACCCTTACT GTAAGTGTAA ATTGTATTGG AGTAATGGGA 
AAAGGGTTGG CCTCTAGAGC AAAATATCAA TTCCCAGATG TTTATGTACA CTATCAAGAT 
CAGTGTAAAA GAAAAACACT TCGAATGGGC AAGCCTGTAT TGTATCAACG TGAAGCCCCA 
TATCATGAAC AAATTGCAGA TGATCCTAGC TCTTTAGGAA ATAAAAAAGA CACATGGTTT 
TTGCTTTTTG CTACAAAACA ACACTGGCGA GATAATAGCG ATATTGAGGG TATAGAGCAG 
GGATTAAAAT GGCTTTTAGA TAACTATGAA CAAAAAGGAA TAGAATCACT TGCAATTCCT 
GCACTAGGTT GTGGTTTAGG ACGTCTAAGT TGGGAAGATG TTGGACCCAT ACTTTGCAAG 
TATCTATCTC AAATGAACAT ACCCGTGTGG ATATATTTGC CTGCAGAAAA ACAACTTTCT 
AATAATTTAC TTACAAAGGA GTTTCTATTG GATAGTTAA

Protein sequence

MDEFKIYTPD LSQYLFYITH IDNIPSMLQN GILSHDQIVK QKLEYTSIYD SDIVSSRREK 
TANGKSLWYF ANLYFQPRNP MLYRVTMEKS PDCIAVVAVD KKILTTPNTI ITDGNAANGP 
THFYPNTEFK TIERQINRIT SLQWWTDSNA TKRQIMAECL VPERIPPEFI RAIYVSNHTL 
ADEIRNSMSS SISIIPEPSM FFQPVRQIPL TSNLSLVEGD LFFSKMQTLT VSVNCIGVMG 
KGLASRAKYQ FPDVYVHYQD QCKRKTLRMG KPVLYQREAP YHEQIADDPS SLGNKKDTWF 
LLFATKQHWR DNSDIEGIEQ GLKWLLDNYE QKGIESLAIP ALGCGLGRLS WEDVGPILCK 
YLSQMNIPVW IYLPAEKQLS NNLLTKEFLL DS