Gene Nmar_1509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1509
Symbol
ID	5774177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	1372252
End bp	1373673
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	40%
IMG OID	641317160
Product	phosphoesterase DHHA1
Protein accession	YP_001582843
Protein GI	161529017
COG category	[L] Replication, recombination and repair
COG ID	[COG0608] Single-stranded DNA-specific exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0271209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAT CACTTGATGA GTCACTTTCG TTTTTCAAAG ATAAAGTTAC AGATTGCATA 
AGATCTAAAA AATCAATTTT TGTTACAACC CACATTGATT GTGACGGGTT GACATCTGGA 
AGTATCATTA CCAAAGCTCT GATAAGAGCT GGGGCAAATT GTACTGTTAG GACATCAAAA 
GAATTTAGCA AAAATGTTGT AGACTCTTTC AAAACAGATT CTAGAGATTT TCACATAGTT 
ACTGATCTTG GAGGAGGTTT TGGAAAGGAC CTCAATGAGA CACTTGGAGA TAACTGGATT 
GTCTTGGATC ATCACCAAAT CCCAGATGAG GAGATAGAGA ATCCAAATGT GATTAATGCA 
TGGAAGTATG GAATCGATGG AGGCCTTGAA ATTTGTGCCG GCGGAATGGC ATATCTAGCA 
TCCATGGCAC TTGATGAGAA AAACTCTGAC TTGTCATCAA TTGCAGTAGT ATCTGCTCTT 
GGAGACAGAC AGGACCAAGG AGAAAGAAAG TCATTTACTG GAAAGAATTT TGAAATCGCA 
AACACTGCAA AAGAACAAGG ACTAGTTGAG ATTGACTTGG ACCTATTATT GGTTGGAAGA 
GAGACAAGAC CACTTCCAGA TGCCTTGGCA TTTACATCCC AGCCATTTAT TGAGGGACTT 
ACCTGGAACA GAGATGCCTG CCTTTCACTA CTAAATTCAT CAGGAATCCA GCTTAAAGAC 
GAGGGCAGAT GGAGGGTTCC AGCAGAGCTA GACGAGGAAG AAAAAAGACA GGTAATCGAG 
TCAATCACCA AATTTACAGC TGGCAAAAAT GCCACAGAGA TAATGTCTGA ATTAATCGGA 
TACACTTACA CATTTCCTAG AGAAGACAAG AGGAGTTTCT TGAGGGATGG TAGAGAGTTT 
TCAACTATGC TAAACTCTTG TGGAAGAATA AACCGCTCCG GAGTCGGAAT GGCAATCTGC 
ATGGGAGACA GAAACAAGAT TCTAAGAGAA GGGGAGACAA TCCTGACAGA CTATAGAAAG 
ATGATCAGAG AATACATGAA CATTCTATCA AATGAGAGAT GGAGGATTTC TGAAAGTGAG 
ACATGTGTTA TGGTAAATGG AGAAGACATT GTCCCTGAAA CAATGACTGG AACCATCTCA 
TCACTAATTG CAGGCTCTCC AAAGAATTCT GGTAAAATTG TAATTCTCAG AACAAAGGGA 
GAAGAGAACA CTATCAAGTT TTCATCAAGA AAGTCATTTG GTTGCAAATC AGACATCAAC 
CTAAGTGATC TGATGAGAGC TGGTGCTGAG AAGTTTGATG GTATTGGAGG AGGTCATGAT 
GCAGCAGCTG GAGCAAAAAT AACTAAAGAC AAATTAGATG AGTTTCTCAA TTATTTAGAA 
GTAAATGTCG TTAACGTGTC AAGTGCAGAT AGTCCTCAGT AA

Protein sequence

MTKSLDESLS FFKDKVTDCI RSKKSIFVTT HIDCDGLTSG SIITKALIRA GANCTVRTSK 
EFSKNVVDSF KTDSRDFHIV TDLGGGFGKD LNETLGDNWI VLDHHQIPDE EIENPNVINA 
WKYGIDGGLE ICAGGMAYLA SMALDEKNSD LSSIAVVSAL GDRQDQGERK SFTGKNFEIA 
NTAKEQGLVE IDLDLLLVGR ETRPLPDALA FTSQPFIEGL TWNRDACLSL LNSSGIQLKD 
EGRWRVPAEL DEEEKRQVIE SITKFTAGKN ATEIMSELIG YTYTFPREDK RSFLRDGREF 
STMLNSCGRI NRSGVGMAIC MGDRNKILRE GETILTDYRK MIREYMNILS NERWRISESE 
TCVMVNGEDI VPETMTGTIS SLIAGSPKNS GKIVILRTKG EENTIKFSSR KSFGCKSDIN 
LSDLMRAGAE KFDGIGGGHD AAAGAKITKD KLDEFLNYLE VNVVNVSSAD SPQ