Gene Nmar_0339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0339
Symbol
ID	5774421
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	302289
End bp	303509
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	31%
IMG OID	641315967
Product	hypothetical protein
Protein accession	YP_001581673
Protein GI	161527847
COG category	[S] Function unknown
COG ID	[COG1641] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00299] conserved hypothetical protein TIGR00299

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTTGG TAATTGATCC TCAAATTGCA GGAATATCTG GGGATATGCT TCTTTCTTCA 
TTAATTGATT TGGGCGCAGA TAAGGGAAAG ATAATTGATG GAATTAAAAA ATCTGAACAA 
TTTTTTTCAG ATTCTACTAT TACAAAAATC GATTTTCAAA AAACCAAAAA AAGAGGAATC 
GAAGCTATTC AACTCGTTTT AGAAATAGAT GAACATTCTC ATGAAAAAAA AGGCTCTGAA 
ATAAAAAAAG CAATTAATGA CTCTACATCA AATTTAGATC TATCAGATAA AGCAAAGATA 
TTTGCTGAAT CATGTATCAA TTCACTCATT TCTTCAGAAT CTAAAATTCA TGGTGTTCCA 
GAGGATTCTG TGCATTTTCA TGAGGCCTCT AGCATTGATA CCCTAGTTGA CATTGTCGGA 
ATTACAATTG CCTTAGATGA TTTGGGATTA TTTGATGAAA AAATTATTTG CATGCCTGTT 
TCTGTAGGTG GTGGAAGCGT AACTTTTTCC CATGGCACTA TGTCTAATCC TGCCAGTGCA 
ATTTTAGAGA TTTTCAAAGA TTCTTATCTG AAAATTAAAG GTAATGATGC AAATGCGGAA 
TTGACCACTC CAACGGGGGC GTGTATTTTG GCTAATCTGA CAAATACTTG TATGGATTAT 
TATCCTGCAA TGAAAATTGA TTCAATTGGT TATGGTGCAG GGCAAAAAGA TTTTCAAAAT 
TTTTCAAACG TGCTAAAACT AGTTAGAGGC TCTACAAATA ACTTGGAAAG TGACTCAGTA 
AAAATTCTTG AAACTAACGT TGATGATATT TCAGGAGAAA TACTTGGAAA TCTAATTGAA 
AAGATCATGC AAAAAGGTGC TAGAGATGTT TCAATTTATC ATGGAATTAC AAAAAAAGGA 
AGACCTACAA ATTTGGTATC TGTAATATGT GATGATCAAA ATATTGATGA AATTGTTGAT 
ACATTGGTAT TAGAAACTGG TACTTTGGGA ATTAGGATAT CTGAATCAAA TAGATTTGTT 
GTACCAAGAA CAAATGAAAA CATTTCATTA ACAATTGATG GAAATTCCTT TGATGTGAGA 
TACAAAAAAT CAACATTTAA GGGAAAAACT GATTTCAAAA TAGAATTTGA TGATCTTAAG 
GATATTTCAA ACACCGTTGA AAAATCAATT AAAGAAATAG AATCATTACT TCGAAAAGAA 
ATTGAAAAGT TGGAGAACTA A

Protein sequence

MVLVIDPQIA GISGDMLLSS LIDLGADKGK IIDGIKKSEQ FFSDSTITKI DFQKTKKRGI 
EAIQLVLEID EHSHEKKGSE IKKAINDSTS NLDLSDKAKI FAESCINSLI SSESKIHGVP 
EDSVHFHEAS SIDTLVDIVG ITIALDDLGL FDEKIICMPV SVGGGSVTFS HGTMSNPASA 
ILEIFKDSYL KIKGNDANAE LTTPTGACIL ANLTNTCMDY YPAMKIDSIG YGAGQKDFQN 
FSNVLKLVRG STNNLESDSV KILETNVDDI SGEILGNLIE KIMQKGARDV SIYHGITKKG 
RPTNLVSVIC DDQNIDEIVD TLVLETGTLG IRISESNRFV VPRTNENISL TIDGNSFDVR 
YKKSTFKGKT DFKIEFDDLK DISNTVEKSI KEIESLLRKE IEKLEN