Gene Nmar_1191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1191
Symbol
ID	5773787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1086413
End bp	1088440
Gene Length	2028 bp
Protein Length	675 aa
Translation table	11
GC content	34%
IMG OID	641316835
Product	hypothetical protein
Protein accession	YP_001582525
Protein GI	161528699
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1331] Highly conserved protein containing a thioredoxin domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGAAA ATAATCTTAT TCATGAAACA AGTCCTTATC TTCTTCAACA TGCTCATAAT 
CCAGTTGACT GGTATGGTTG GAATGATGAA GCATTAAAAA AAGCAAAAGA TGAAAACAAA 
CCGATCTTTC TTAGTATTGG TTACAGTTCT TGTCATTGGT GCCATGTTAT GGCACATGAA 
TCATTTGAAA ATGAAGAAGT TGCAAAATTC ATGAATGAAA ATTTTGTAAA TATCAAAGTA 
GATAGAGAAG AACGCCCTGA CATTGATGAC ATTTATCAAA AAGCTTGTCA GATAGCTACT 
GGTCAAGGAG GATGGCCTTT GAGTATTTTC TTAACTCCTG ATCAAAAACC ATTCTATGTT 
GGAACTTATT TTCCAATTCT GGATTCTTAC GGTCGTCCGG GATTTGGGAG TATATGCAGA 
CAACTATCTC AAGCTTGGAA AGAAAAACCT AAAGACATTG AAAAATCTGC AGATAATTTT 
CTTGATGCAC TAAATAAAAC TGAAAAAGTT TCTATTTCTT CAAAATTAGA AAGAACCATT 
CTTGATGAGG CAGCAATGAA TCTTTTCCAA CTGGGTGATT CTGCTTATGG TGGATTTGGT 
TCTGCTCCAA AATTTCCAAA CGCTGCTAAT GTTTCCTTTT TGTTTCGTTA TGCAAAGATA 
TCTGGGTTGT CAAAATTCAC AGAATTTGGG CTCAAAACTC TCAAAAAAAT GGCAAATGGT 
GGAATATTTG ATCAAATTGG TGGTGGATTT CATCGATATT CTACAGATGC AAAATGGCTT 
GTACCTCACT TTGAAAAAAT GCTCTATGAT AACGCACTAA TTCCTGTAAA TTATGCTGAG 
GCATTTCAGA TAACAAAGGA TCCTTTCTAT CTAGATGTCT TGAAAAAAAC CCTTGATTTT 
GTTTTGCGTG AAATGACTTC TCCTGAAGGT GGTTTCTATT CTGCATATGA TGCAGACTCT 
GAAGGTGTAG AGGGAAAATT CTATGTCTGG AAGAAAAGCG AGATTAAAGA AATTCTTGGT 
GATGATGCTG ACATCTTTTG CTTATTTTAT GATGCCACTG ATGGTGGAAA CTGGGAAGGA 
AACAACATTT TGTGTAATAA CTTGAATATC TCTACAGTTG CCTTTAATTT TGGAACTACT 
GAAGAAAAGG TTAGAGAAAT TCTTCAGGCC TGTTCTAAAA AGTTACTTGA TGTTCGTTCC 
AAGAGAGTTG CCCCTGGACT GGATGATAAA ATTCTAGTTT CGTGGAATTC TTTAATGATT 
ACTGCCTTTG CTAAGGGTTA TCGTGTAACA AATGAATCTA GATATCTTGA TGCTGCAAAA 
GATTGTATCT CCTTTATTGA AAATAATTTG TTTTCAGGAG ACAAGTTACT ACGAACTTAT 
AAAAACAAAA CTGCAAAAAT TGATGGCTAT CTAGAAGACT ATTCTTATTT TGTAAATTGC 
TTGTTAGATG TATTTGAAAT TGAACCTGAT CCAAAATATC TAAAACTTGC ACTAAAACTA 
GGCCATCACT TGGTGGAACA TTTCTGGGAT TCAGAAAACA ATAGTTTCTT TATGACTTCA 
GACAATCATG AAAAACTGAT TATACGACCC AAAAGCAATT ATGATTTGTC TTTGCCTTCT 
GGAAACTCTG TTTCTGCATT TGTCATGCTC AGACTATTCC ATTTCTCTCA AGAACAACAA 
TTCTTAGATA TTGCTACAAA AATCATGGAA TCTCAGGCAC AAATGGCTGC TGAAAATCCA 
TTTGGATTTG GATATCTGCT AAACACAATT TCAATTTATT TGGAAAAACC TGTTGAAATC 
ACAATCATAA ACACTGAAAA TTCTCAACTT TGTGACTCAA TTCTTTTGGA ATATTTACCA 
AACTCAATTG TTGTCACTAT TCAAAATTCT ACTCAGTTGT CGGCTCTATC TGAATATCCT 
TTCTTTGCTG GAAAATCTTT TGAAGAAAAA ACATCTGCAT TTGTTTGTAA AAACTTTACT 
TGTTCATTAC CTTTGCATAC TATTGATGAA ATAAACTCAC ATCTTTAG

Protein sequence

MTENNLIHET SPYLLQHAHN PVDWYGWNDE ALKKAKDENK PIFLSIGYSS CHWCHVMAHE 
SFENEEVAKF MNENFVNIKV DREERPDIDD IYQKACQIAT GQGGWPLSIF LTPDQKPFYV 
GTYFPILDSY GRPGFGSICR QLSQAWKEKP KDIEKSADNF LDALNKTEKV SISSKLERTI 
LDEAAMNLFQ LGDSAYGGFG SAPKFPNAAN VSFLFRYAKI SGLSKFTEFG LKTLKKMANG 
GIFDQIGGGF HRYSTDAKWL VPHFEKMLYD NALIPVNYAE AFQITKDPFY LDVLKKTLDF 
VLREMTSPEG GFYSAYDADS EGVEGKFYVW KKSEIKEILG DDADIFCLFY DATDGGNWEG 
NNILCNNLNI STVAFNFGTT EEKVREILQA CSKKLLDVRS KRVAPGLDDK ILVSWNSLMI 
TAFAKGYRVT NESRYLDAAK DCISFIENNL FSGDKLLRTY KNKTAKIDGY LEDYSYFVNC 
LLDVFEIEPD PKYLKLALKL GHHLVEHFWD SENNSFFMTS DNHEKLIIRP KSNYDLSLPS 
GNSVSAFVML RLFHFSQEQQ FLDIATKIME SQAQMAAENP FGFGYLLNTI SIYLEKPVEI 
TIINTENSQL CDSILLEYLP NSIVVTIQNS TQLSALSEYP FFAGKSFEEK TSAFVCKNFT 
CSLPLHTIDE INSHL