Gene Nmar_0842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0842
Symbol
ID	5774182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	743238
End bp	744203
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	32%
IMG OID	641316480
Product	luciferase family protein
Protein accession	YP_001582176
Protein GI	161528350
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000207214
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTATTG CATGTAGTCT AGGCTCAATG TTATCCGTAA ATGAGGTTCT AAATTGTGCC 
GAAATTATAT CTAAAACCAC TGCAGACGCA ATCTGGATGC CTGAAACATG GGGTATGGAG 
AATTTTTCAA TGTTAAGCGC AGTATCAAGC AAAACTTCTA CTCAAAAAAT AGGCTCATCA 
ATCATCAACA TCTATTCTCG TAGTCCTGCA GCAATTGCAA TGGGGGCAGT CACAGTAGAT 
ACAATATCTA AAGGAAGGGT AATTCTAGGT CTCGGAACTA GTAGTTTGCC AATCGTAGAG 
ACTTTTCACG GATATAATTT TGAAAAGCCT TTGCAAAGAA TGAAAGAATA TGTTGAGATA 
ATCAAGATGA TAACATCTGG AAAACCAATA AACTATTCAG GAAAAATTTT CAATTTGAAA 
AATTTTACAT TATTGATCAA ACCACAAAGA GAATCAATTC CAATATACAT TGCAGCAGTT 
AATGAAAAAA TGGTAAATTT AACATGGGAT CTTGGAGATG GTGTGATTTT TTATCTTAGA 
CCTAAAAATG AAATGAAAGA AACGATTCAA AAAATGCAAT CAAAAAGAAA GATAGACGTC 
ACATGTCAAA TAATTACATG CGTATCAAAT AACGCAGAAG AAGCAATAGA ACGTGCAAAA 
AAGACATTAG CATTCTACGT TTCCGTTGGT AAAATCTATA GAGAATTTTT GGCAAAAAAT 
GGATTTGAAA AAGAAACATC AAACATATTT GAAGAATTTA AAAAATCAGG ATTTTCATCA 
AATCATGAAC TAGTCCCAGA TTCAATGTTA AAAGAACTTA CAATATCAGG AACTCCTGAA 
GAATGTAAAA AACAACTTGA TGTTTTCAGA CAAACAGGAA TTGATTTGCC AATAATACAA 
TTCAATCCAG TAGGTGACAC AATGGAATCG TTTAGATTAT TACAAAAAAC ATTTTTGGAT 
GAATGA

Protein sequence

MRIACSLGSM LSVNEVLNCA EIISKTTADA IWMPETWGME NFSMLSAVSS KTSTQKIGSS 
IINIYSRSPA AIAMGAVTVD TISKGRVILG LGTSSLPIVE TFHGYNFEKP LQRMKEYVEI 
IKMITSGKPI NYSGKIFNLK NFTLLIKPQR ESIPIYIAAV NEKMVNLTWD LGDGVIFYLR 
PKNEMKETIQ KMQSKRKIDV TCQIITCVSN NAEEAIERAK KTLAFYVSVG KIYREFLAKN 
GFEKETSNIF EEFKKSGFSS NHELVPDSML KELTISGTPE ECKKQLDVFR QTGIDLPIIQ 
FNPVGDTMES FRLLQKTFLD E