Gene Nmar_1724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1724
Symbol
ID	5774125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1580685
End bp	1581749
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	34%
IMG OID	641317378
Product	peptidase M24
Protein accession	YP_001583058
Protein GI	161529232
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0292375
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACAAC GTAGAAAAAA TCTACTAAAA CACGCCCAAA AGATCGGTTG TGATACATTA 
GTTACTTTTG AGCCTGAAAA CCTCTTTTAC ATGACTGGGT TTTGGGGCGA AGCAATAGGC 
CTGTTAGAAA AAAATGGCAA AACCACCATT ATTGCACCTG AACTTGAGGT TGGAAGAGCA 
AAAGATGAAT CTGAAGACTG TGATGTAATT ACAGCAGAAC GTGGAACTGG TCTTGTAACT 
TCGCTTGTAA AGAAAATAAA GAAAAATCGC GTTTGTACTG ATTGCCAAAA TTACTCTATA 
ATGACATCTT TGAAAAAATC TATTCCAAAA ATAAAATCCT CTACAGAACC ATTTTACAAC 
GCTCGTATAA TCAAAGACGA AAATGAGATC AAAATCCTCA AAAAAGCATC CAAAATCATT 
GATGAAATGT TTGAAACCTG TTCAAAAAAG ATCAAAGTGG GCCAAAAAGA GTCAGAATTA 
CAAACAATTT TGATGACTTA TGCAATGGAG CAACAAATGT TTGATACTGG ATACAAATCT 
ACTCTGAATC CTCTAATTAT CGCTGGAGGC CCCAATGGTG CATTGCCTCA TGCTCAAGTA 
ACACAAAGGA AGTTCAAAAA AGGTGATCTT GTTGTAACTG ATCTTACACT AAGATACAAA 
GGATATGTTT CTGATGCAAC AAGAACATTT GCAATAGGAA ATGTTTCATC GCAAACTAAA 
GAAGCATATG AAATTGTTAA AGAATCTCAA AAACTTGGAT TAAAAGCTGT AAAACCAAAT 
GCAAATTGTA AGGATGTTGA TTTTGCATGC AGAAAATACA TTGATGATAA AAATTATGGA 
CAATACTTTA TTCATTCAAC TGGTCATGGA ATTGGATTGG AAGTTCACGA ACTTCCTACT 
GTTTCATACA GGAGTGACAC AAAACTTAAA GAAAATATGG CAATTACTGT AGAACCTGGA 
ATCTATATCG AAAATAAATT TGGAATACGA ATAGAAGATT CTTTGATTGT AAAGGAAAGA 
CCTATTGTTA TGCACAAATT CACTAAAGAT TTAATCACAA TTTGA

Protein sequence

MKQRRKNLLK HAQKIGCDTL VTFEPENLFY MTGFWGEAIG LLEKNGKTTI IAPELEVGRA 
KDESEDCDVI TAERGTGLVT SLVKKIKKNR VCTDCQNYSI MTSLKKSIPK IKSSTEPFYN 
ARIIKDENEI KILKKASKII DEMFETCSKK IKVGQKESEL QTILMTYAME QQMFDTGYKS 
TLNPLIIAGG PNGALPHAQV TQRKFKKGDL VVTDLTLRYK GYVSDATRTF AIGNVSSQTK 
EAYEIVKESQ KLGLKAVKPN ANCKDVDFAC RKYIDDKNYG QYFIHSTGHG IGLEVHELPT 
VSYRSDTKLK ENMAITVEPG IYIENKFGIR IEDSLIVKER PIVMHKFTKD LITI