Gene Nmar_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0043
Symbol
ID	5774145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	33030
End bp	34121
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	36%
IMG OID	641315660
Product	hypothetical protein
Protein accession	YP_001581381
Protein GI	161527555
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTTAG GCGTGAAAAC TCTACTAAAC CGATTTTGTC AACTTTCATA TTTGATCCTT 
CAAAGAAATC ATCAAATGAA CTGGAGACTT GCAGCTATTC CTGCTACATT AATTCCAATT 
ATCATTATAG CTATTCAATT TGATATCAAA CCTGAAGACG TTCTTGCAAT CGGTTTCTTT 
CCATTTGTCG GTGCAGTTGT AGCAATGATG ATAAAACTAG GACTTCAAGG AGTAAAGTTT 
GCCTACATTG CAAGGAGATA TCTTGGCAAT TTTGATTCTG TTTTGAAATT AACTGGAGTT 
CGTGTCGGTA GTGAGTTTAT CAAATTTACA ACTCCGATGT TTATTGGAGC AGAATTCATC 
GTAATCTATT ATTTGCACAA AAAGGGAGTA AAGCCCTCAA AATCAACATG GATTGCAATA 
ATGGATATTG TAACTGAAGT GTTTGCAGCT GGATTGTTAT CTATAATGGC AGGAATAATT 
GCACTGCTAA ATGGAGCATA TGTTGTTGCC GCAGTAGTTT TGGGAACCAG CATTACTGTC 
ACCACATTGT GGATGGTACT ATTCTTCTTG TCTTCTAAAC GCACATTCCA AGTTCCTAAA 
GTTTTGGGAA AACTTGCACA AAGATTTGGA AAAGAGAAAG GTACCAAGTA TATAGAACAA 
ACAAACTCTT GGATGGAAGA AGTGTGTACT ATGAGTAGAG AAAATCTCAA AACTTCTGAA 
TCAAAAAAGG TCTTTACAAT ATCATTCTTG TTTTCAATAG CATCTTGGTC ATTTTATGGA 
ATTTCATTTA TGATCATTGC AATGGGAACT GGATATGTTA TCAACGCATT TGATTCTATT 
ATGGCTGTAA TGGGGGCAAA TGCAATTGGA AATCTTCCAA TCACTATTGG TGGTTCTGGC 
CTTGCTGAAT TTGGAATTGT TGCATATCTT AACAATCTAA ATCCATTTGA CTTTGATGCT 
TCCCAAGGTG GTTTAGCTTG GGATGCAGTA ATAGGCTGGA GAATTGCAAC ATACTATGTA 
CCAATTGTGA TTACTTGGTT GCTTTTAGTA AAACTAGCCT TGAGTAGAAT CTCAAAACCT 
CAAGCCACAT AG

Protein sequence

MVLGVKTLLN RFCQLSYLIL QRNHQMNWRL AAIPATLIPI IIIAIQFDIK PEDVLAIGFF 
PFVGAVVAMM IKLGLQGVKF AYIARRYLGN FDSVLKLTGV RVGSEFIKFT TPMFIGAEFI 
VIYYLHKKGV KPSKSTWIAI MDIVTEVFAA GLLSIMAGII ALLNGAYVVA AVVLGTSITV 
TTLWMVLFFL SSKRTFQVPK VLGKLAQRFG KEKGTKYIEQ TNSWMEEVCT MSRENLKTSE 
SKKVFTISFL FSIASWSFYG ISFMIIAMGT GYVINAFDSI MAVMGANAIG NLPITIGGSG 
LAEFGIVAYL NNLNPFDFDA SQGGLAWDAV IGWRIATYYV PIVITWLLLV KLALSRISKP 
QAT