Gene Nmar_0584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0584
Symbol
ID	5773013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	520425
End bp	522080
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	32%
IMG OID	641316218
Product	hypothetical protein
Protein accession	YP_001581918
Protein GI	161528092
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGTAA TGGGCGTATT TTTCACGATT TTTCTAAATT CCGCACATGC TCAAACTGTG 
GGGGATCAGA CAACTTTGTC AGGAGATCTA CAAAACAATC CTATTGCCCA AGACATTCTT 
AAAAAAATTG AACAAAGTAA AAAATGGATT GCAAAAATTG AACAAAGAAA TTTTGAAGAT 
TCTCAACGAC AAGCAGAATT AGAACAAAAG CGTGCTGAAA TTTTACAAAG TTTGGAAGAC 
GATTTAAGAA AATGGGAAGA ACTTTGGGGT TACTATACAT TTGATAATAT ACTTGAAAGA 
GCATTAGAAA ATAGTCCTGC AAAGGACACT TCTAGCATTT ATGATCATCC TCTAAAATTT 
ACTGCTTCTA AAATTAATGC TGGAAAAGAA GCTTTGCAAA AAGTAATCTT AGAAGGGGGA 
AATTCTGAAC AAGCAAGAGA CGCATTTGTC AAAGCTGCAA AAATAACAAG AGCTGAAATG 
GTGTCTGTTA ATGCATTTTA TAATATTTTG AACAATAATG CTTACTACAA TCAACAAGTA 
CTCTTTGAAT CTGATGGTAG ATTCAACTAT GATTTGTCTG GGGAAGAATT GAGAAAATAC 
TATCAAGATT TTAGAACAAA TCCTGCATAT TTTGAAGCAA ATCCTCTTGA TGAAGTTTCT 
TGGTCTGATC TTGGCAAAAC TAATTTTGAT ACTGAATGTA GAACAGGACA TGTTTTAGTT 
TACAGAACTC ATGCAGATGA TTATGTTTGC ACTACTGAAT ATACTGCTGA AATGTGGGTA 
CGACATGATA TGGGAAAACT TGCTAATGGA ATTAATGAAG AACGACATAA TCTGCTAAAT 
GAACAGAAAT TCAACAAAGA CAGAATTTTA CAAAAGGCAG ATAGTTTAAA CTCTAAAATC 
AAAACCATAC AAACACACTA TGAAGCAGAA ATCTCAGAAA TACTTGCAAA ATATGACTCC 
CTTATGACTG ATATCGAACT AGACAAACGT GCTGAAGAAA AACAAATTCT TGAAAATTCT 
GACTCTGATT CAAAAAAGAC AATCAGTCAA CAAATTGCCA ATATTCGAGA AAAATTTGAT 
GAACTTGAAA AAAACACTCT TGATGAAAAA GACGACGTTT TGAAGATTCT AGCAAATCAA 
CATATTACCT CAATAGAAGA ATTTGCATCT CTCTATGAAC TTGATGATGA AATCAAAATT 
GAATGGAATG CTGATTCTCT GACTTTTTAC CCATCTGCAT ATTATTTTCC ACAACAATCT 
GAATCTAGTT TAATCGTAAA GACTAGTTCT GAAAATACTA TTTCTGATTT TCTTGTTGAT 
GACACAAGTT TCAAAAATGC ATTTGGTGAA AAAATACATT CACTAAAACC AGGTCAATTA 
GTTCAGATTG CTTCTGATGT TACAAATAAT GATAATTTTT CAAAAAAATT TGTTTATCTA 
GTTGAAATTA AAGATGAACA AAATCAAATA GTTCAACCTC TAAAGTGGAT AACAGGCCAA 
CTTGATTCAG ATCAAGTCCT TAATTTGGGA TTGTCTTGGA TTCCACAAAC TCCTGGTAAT 
TTTTATGCAG ATGTTTTTGT TGGAACTAGC TTAGACTTTG TGTCTCACAC AGAAACCATT 
TCTATTTCTG TAACTCCACA AGATCATTTG TCCTAA

Protein sequence

MLVMGVFFTI FLNSAHAQTV GDQTTLSGDL QNNPIAQDIL KKIEQSKKWI AKIEQRNFED 
SQRQAELEQK RAEILQSLED DLRKWEELWG YYTFDNILER ALENSPAKDT SSIYDHPLKF 
TASKINAGKE ALQKVILEGG NSEQARDAFV KAAKITRAEM VSVNAFYNIL NNNAYYNQQV 
LFESDGRFNY DLSGEELRKY YQDFRTNPAY FEANPLDEVS WSDLGKTNFD TECRTGHVLV 
YRTHADDYVC TTEYTAEMWV RHDMGKLANG INEERHNLLN EQKFNKDRIL QKADSLNSKI 
KTIQTHYEAE ISEILAKYDS LMTDIELDKR AEEKQILENS DSDSKKTISQ QIANIREKFD 
ELEKNTLDEK DDVLKILANQ HITSIEEFAS LYELDDEIKI EWNADSLTFY PSAYYFPQQS 
ESSLIVKTSS ENTISDFLVD DTSFKNAFGE KIHSLKPGQL VQIASDVTNN DNFSKKFVYL 
VEIKDEQNQI VQPLKWITGQ LDSDQVLNLG LSWIPQTPGN FYADVFVGTS LDFVSHTETI 
SISVTPQDHL S