Gene Nmar_0291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0291
Symbol
ID	5774209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	257852
End bp	258958
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	34%
IMG OID	641315916
Product	peptidase M50
Protein accession	YP_001581625
Protein GI	161527799
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00037958
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGAGG AATCTCAAGA CGACATAATT TCTTTAGTAA ATTCCATCTT TGATGTAAGT 
GATTTTATAA AAACTGAATT TTCAATGGAG TTTCGAATTG AAGATATTGA GTTCAAATCC 
AAATTTGAAA AATTAGCAAG AAGATTAGAA GGAATGAGTT TTGCATGTAG ATTAGAGCAA 
AAAGATGGTG GAAAGTTTGT TATTATTCAA AAGTTTGCGA TAAAAAAACA AAGAAGGTGG 
ATGAAAACTG CATGGACACC AAGAGCTTTG TTTGCAATTG TAGTTGCATT TGTTATGGTT 
GATGGATACT ATAGAACATC TGGAACAAAT TCTATTGTTG AAATTGGAGA ACCACTTGAG 
ATGGCAGCAG TTTACACATT ATCTTTGCTA GGAATTTTAG GAATTCATGA ACTAGGACAC 
ATAATTGCAG CAAAAGCCCA CAGATTAAAA ACTACATGGC CATACTTTAT TCCAGGTCTA 
CCAGTAATAG GAATCCCAAC ATTTGGGGCA TTTATTCAAT CAAGGGGATT GACCATCAAC 
AGAGAAATTT TGTTTGATGT TGCAATAGCC GGTCCAATAG CAGGATTAGT GATTGCAGTA 
ATTGTTTCAA TATATGGAGC ATATACTGCA CCAATTTTAG AACCTGAAAT TGCTGCAGGG 
TTATTTGAAG AATCTAGACT AATGGAATGG GAGCAAGGAG AGCCATTGTT AATGACTGCA 
AGTCTTGCAA TGTTTGGAAA AGGAGGTTCA GGACATGAAG TAATTATGAC TCCAATAATG 
TTTGCAGCAT GGATTGGATT TCTAATTACA TTTTTGAATT TACTTCCAGC ATGGCAACTA 
GATGGAGGTC ATATGGCCAG AACTTTGTTG GGTCCAAAAT TACATAGATA TGCAACTTTT 
GGCAGTATGG CAATTCTAGT TTTGTTAAAT TATTGGTTAA TGGCAATTTT AATTCTAATA 
ATGAGTTCAA GAAATCCTAG TGCAATGCCA TTAGATGATA TTTCGCCACT TTCAAGAAAT 
AGAAAATTAG CATATATTGG AATTATTGGA TTGGCAATTT TATGTGCACC ATTACCATCA 
GATTTTTTGC CTAATTTCCT ACCTTAG

Protein sequence

MDEESQDDII SLVNSIFDVS DFIKTEFSME FRIEDIEFKS KFEKLARRLE GMSFACRLEQ 
KDGGKFVIIQ KFAIKKQRRW MKTAWTPRAL FAIVVAFVMV DGYYRTSGTN SIVEIGEPLE 
MAAVYTLSLL GILGIHELGH IIAAKAHRLK TTWPYFIPGL PVIGIPTFGA FIQSRGLTIN 
REILFDVAIA GPIAGLVIAV IVSIYGAYTA PILEPEIAAG LFEESRLMEW EQGEPLLMTA 
SLAMFGKGGS GHEVIMTPIM FAAWIGFLIT FLNLLPAWQL DGGHMARTLL GPKLHRYATF 
GSMAILVLLN YWLMAILILI MSSRNPSAMP LDDISPLSRN RKLAYIGIIG LAILCAPLPS 
DFLPNFLP