Gene Nmar_0975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0975
Symbol
ID	5774771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	851328
End bp	852485
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	36%
IMG OID	641316614
Product	hypothetical protein
Protein accession	YP_001582309
Protein GI	161528483
COG category	[S] Function unknown
COG ID	[COG1602] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.109067
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTG ACTCTCAGGA TATTCGCCGT TCAATTTTAA CAAAATGGCA TGAGACATTA 
TCAAAATATG GAAATTTGTT TTCATCTGAT TCAATAAGTG GTACTAGTCC TCCATCTGTA 
TTTGTTGGGT CGTACAATTA TCCTAAGGTC TTTGTTGGTC CAATGGTTCC ACCAATTCAT 
GGAGATACAA GTTTACTTGA CAGTCCTGAA AAATGGAAGG GAAAGTCTTT AGAAGAAATT 
GTAAACTTTA GATTGAATTT AGTTCGTGGC ACACAAAAAC TATCTATCGA TAAAACTGAT 
GGACGATACA TTGAAAATCT CCAAGAAGTA ACAATGTCTT CAAAACCAAC TGATTCTGAT 
TTAATATTTC AAAAATCTGT ATCTTCAAAC ATTTCCCTTG ATGGAGAAAG TGCTCCATTT 
GGTCCTGTTG GGGAAATCAA ATCTGCAAAA TTCTCTGGAA CCTCTTCTGT AAAGTCTATT 
GAAAAGACAT ACTATGATAA AGATTTGAAG GCACAGGATG CTGTCATGAA CTTATACAAT 
TCTGGAATTG ATATTTCAAA AATTCAAAAA TGCTTTAGCA TTGGAATGCT TGGCCAAAAA 
AGAAAACTCG TTCCAACAAA ATGGAGTATT ACTGCAACTG ATGACATTAT ATCACAATCT 
CTTGCTGACG AAGTATTAGA TTATGCCCTA ATTGACTCTT GTAAGGTCTT CTCATATTCT 
CATTTGGGAA ATCATTTCTC TGTGGTTTTG TTCCCTCATA GATGGATATA CGAAATGGTT 
GAGGCATGGT ATTCTAATGG AATTCTAGGG TTTGGCTCTG ATTTTGAGGA TGCCCGGGGT 
ATTGACCATC CTCCTGCCAT AGCTGGTGCG TATTTTGCTG CCAAATTAGG TGTTTTAGAG 
TATCTCAGTG CAAAAAAGAT TCAATCTGGA GCCGTAATTT TAAGAGAAAT CCGACCTGAA 
TATGCAATAC CTGTAGGCGT CTGGCAGGTT CGTGAAGGAA TTAGAGAAGC AATGAAACAA 
ACCCCAGTAA TTGCAAATAA TTTTGATCAT GCATTGAATT TGGCATCCGA GAAACTAAGC 
ATTAGCAAGT CTGAATGGCT TGCACATGGA AATATCTCCA AACTAATGAG ACAAAAAACT 
TTGTCAGACT TTTTCTGA

Protein sequence

MSSDSQDIRR SILTKWHETL SKYGNLFSSD SISGTSPPSV FVGSYNYPKV FVGPMVPPIH 
GDTSLLDSPE KWKGKSLEEI VNFRLNLVRG TQKLSIDKTD GRYIENLQEV TMSSKPTDSD 
LIFQKSVSSN ISLDGESAPF GPVGEIKSAK FSGTSSVKSI EKTYYDKDLK AQDAVMNLYN 
SGIDISKIQK CFSIGMLGQK RKLVPTKWSI TATDDIISQS LADEVLDYAL IDSCKVFSYS 
HLGNHFSVVL FPHRWIYEMV EAWYSNGILG FGSDFEDARG IDHPPAIAGA YFAAKLGVLE 
YLSAKKIQSG AVILREIRPE YAIPVGVWQV REGIREAMKQ TPVIANNFDH ALNLASEKLS 
ISKSEWLAHG NISKLMRQKT LSDFF