Gene Nmar_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0653
Symbol
ID	5774463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	592793
End bp	593812
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	31%
IMG OID	641316289
Product	hypothetical protein
Protein accession	YP_001581987
Protein GI	161528161
COG category	[S] Function unknown
COG ID	[COG4301] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03438] probable methyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.671427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACAATA CCTTACAAAA AAACAAAGAA TACAAGAAAT TTGTTGTTGA TTCCAGATTA 
CAATATTTCA AACCTCATGC CACAAAAATT GAAAAAACGT TTGCTGAAGA AATCTCATCT 
GGCCTTGGAA CTAACTCTAA ATCTATTCAT CCCAAATTTT TCTATGACAA GAAAGGTTCT 
GAGTTGTTTG AAAAAATATG TTCTGTTCCA GAATACTATC CTACTAGAAC TGAAATTTCT 
ATTCTGAAAA AACTCCAGAG TGAACTGTCT TCCTACTTGG ATGAAGACTT TAGATTGGTA 
GAATTAGGCA GTGGTTCCTC AACAAAAACT CGGTTAATCC TGGACTTTTT GACATCTCAA 
AAAACTCTCG AGTACTTTCC AATAGATATC TCTGAAATTC TTACAGAAAG TTCTGAAGAA 
TTACTAAATG ATTATCAAAA TCTTACAATT ACTGGCATTA TCGATACTTA TGAGGGTGGT 
TTAGAATTTT TAAAAACATA TGATGATAAA AGCAATCTCA TCATTTTCCT GGGTTCCAGT 
TTTGGTAATT TCTCTCCAAT TGACGGGTAC AAATTTTTAG AAAAAGTTTA TGCTACTATG 
AAACCTGGTG ATTTGTTTTT GATTGGACTT GATCTTGTAA AAGACAAAAC CATTCTTGAA 
TCTGCTTATA ATGACTCTGA AGGCGTAACT GCAAAGTTCA ATCTTAATGT TTTATCTAGA 
ATTAATGACG AGCTTGATGC TGATTTTAAT TTACAAAACT TTTCACATCA TGCTATTTAC 
AATGAAAAAG ATCAGAGAAT TGAAATGTAT TTGAAATCTC TGGTTGATCA ATCAATAATC 
ATATCAAAAT CTGATTTGGA ATTAAAATTA CAAAAAGATG AATTGATTCA CACTGAATAC 
TCTCACAAAT ATAGATTATC TCAAATTCAT GATCTTCTTG ATGATGTTGG ATTTGAGTTA 
AAACACACCT GGCTTGACGA TAAAAAATAT TTTTCATTAA CTTTGGTCTC AAAAACTTGA

Protein sequence

MNNTLQKNKE YKKFVVDSRL QYFKPHATKI EKTFAEEISS GLGTNSKSIH PKFFYDKKGS 
ELFEKICSVP EYYPTRTEIS ILKKLQSELS SYLDEDFRLV ELGSGSSTKT RLILDFLTSQ 
KTLEYFPIDI SEILTESSEE LLNDYQNLTI TGIIDTYEGG LEFLKTYDDK SNLIIFLGSS 
FGNFSPIDGY KFLEKVYATM KPGDLFLIGL DLVKDKTILE SAYNDSEGVT AKFNLNVLSR 
INDELDADFN LQNFSHHAIY NEKDQRIEMY LKSLVDQSII ISKSDLELKL QKDELIHTEY 
SHKYRLSQIH DLLDDVGFEL KHTWLDDKKY FSLTLVSKT