Gene Nmar_0336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0336
Symbol
ID	5773772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	298821
End bp	300401
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	36%
IMG OID	641315964
Product	radical SAM domain-containing protein
Protein accession	YP_001581670
Protein GI	161527844
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCGGCA AACGTGTTGT ACTTACTGCT GATCGTAGTT TAATGACAAA TTACAGGGGA 
AACTTTCTGT ATGGATTTAT TGCATGTGGA CCATATGAAG TTCTGCCAGA ATGGGTTTTT 
GACAAAGTGT TTTGTCCATC AGTTGAAACA GATCCAATCA CGGGGGAAGC AAAGGTTGCA 
CAAATTGGAT TAAGAAGAAT TGAAAGTTCA TTGATTCAAG GAGGTTACAA TAGAGAAGAT 
GTATTCATTG GACACCCAGA TATGTTGCAC AAATCAATTG GTCCAGATAC CAAAGTTGTA 
GGAATCAATG TGATGGATCC ATTGGGAATG GCACCAGTTA CCACAACAAT GTCACCAGAA 
AAATTGTCGT ATGTAGCAAT GAAATTTAAA AAAATGTGTG CAAGTATAAT TCAGCTCAAA 
AAGAAATATG ATTTCAAAGT TGTTGTTGGA GGAAACGGAG CATGGGAATT AGCAAAATCA 
GATAGAATGA AGATTCATGG AATAGACACA GTAGTAGTTG GAGAGGCAGA TGAATTAGCA 
GTTGATTTGT TCCAAGATTT GGAGAAAAAT GATGCACCAG AATTGATGCA CTGTTTTGTA 
AGAAACCTTG AAAATATTCC AGTTATTGAA GGTCCTACAA TCAACTCATT GATTGAAGCA 
ATGAGAGGTT GTGGAAGAGG TTGTGATTTT TGTGATGTAA ATAAGAGATC AAAAAAAGAT 
TTACCTATAG ATAGATTACA ACACGAAGCA AAAACTAATT TAGATTACGG TTTTGACTCA 
ATCTGGTTAC ATTCTGATGA AATGTTACTT TATGGATGTG ATAACAGAGA CTTTGTTCCA 
AACAGAGATG CAATTACAGA TTTGTGGAAG TCACTAAAAG GACTAGGTGC AAACTTTATT 
GGAACTACAC ATATGACATT TTCTGCAGTT GCTGCAGATC CTACACTAAT GCAACAAATT 
TCTCATGTAA ATGGACAGGA CCAATCAGGA AGATGGCTTG CAACCAATTT AGGAATTGAA 
ACAGTTGCAC CAGATATGGT AAAAAAACAC CTAGGTGTTA AAACAAGACC ATTCTCAACA 
GAAGAATGGG GCAGTGTAGT TAGAGAAGGT GCAAAAATTC TTAATGAGAA CCACTGGTTC 
CCAGCAGCTA CAATCATTAT TGGTTGGCCA GATGAAACAC CGGATGATAT TCAATATACA 
ATTGACATGA TGAGCGACTT TAGAGAAATG GACTTTAGAG GATTAGTAGC ACCATTATTG 
TATCAAGATT TTAGTGAAAA GAATTCAATG CACTTTGGAA ACTTGAATGA AGCTCAATTT 
ACACTATTTT GGAAATGCTG GGAAAACAAC CTTAGAGTAA TTAATGACAT TATTCCAATT 
ATTCTCAGAA ACAAGACCTA CGGTCCACCA ATGAAAGTTT TCATGTATGG AATTTTGAAG 
GCAGGAACTT GGGCAATTAT GAGATATCTC AGAGGATTGT GCAAGGATCT CTTTAATGGA 
AGAACTCCTG ATGAGATAAT TGACAAATAT GCTAGAAGTA GATCAGTATC TGCTCCTAAA 
ATTCAAACAA AGAAATTATA G

Protein sequence

MSGKRVVLTA DRSLMTNYRG NFLYGFIACG PYEVLPEWVF DKVFCPSVET DPITGEAKVA 
QIGLRRIESS LIQGGYNRED VFIGHPDMLH KSIGPDTKVV GINVMDPLGM APVTTTMSPE 
KLSYVAMKFK KMCASIIQLK KKYDFKVVVG GNGAWELAKS DRMKIHGIDT VVVGEADELA 
VDLFQDLEKN DAPELMHCFV RNLENIPVIE GPTINSLIEA MRGCGRGCDF CDVNKRSKKD 
LPIDRLQHEA KTNLDYGFDS IWLHSDEMLL YGCDNRDFVP NRDAITDLWK SLKGLGANFI 
GTTHMTFSAV AADPTLMQQI SHVNGQDQSG RWLATNLGIE TVAPDMVKKH LGVKTRPFST 
EEWGSVVREG AKILNENHWF PAATIIIGWP DETPDDIQYT IDMMSDFREM DFRGLVAPLL 
YQDFSEKNSM HFGNLNEAQF TLFWKCWENN LRVINDIIPI ILRNKTYGPP MKVFMYGILK 
AGTWAIMRYL RGLCKDLFNG RTPDEIIDKY ARSRSVSAPK IQTKKL