Gene Nmar_1684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_1684
Symbol
ID	5774319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	1543991
End bp	1545364
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	34%
IMG OID	641317338
Product	hypothetical protein
Protein accession	YP_001583018
Protein GI	161529192
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.996577
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCAA TTACAAAACT TTCAATTTTG GCTCTAGCCG CATGTTTGCT GTTTCCAGCT 
AGTAGTGTTT ATGGTCATGG ATTGGGAATT GATACTATAT CTTCAGTAGA TGTTGCTGGA 
AAAGAAATCT CAATTTCAGT TGAGATGCCA ATGTACTTTG AAAGTGAGCA AGAACAAATC 
ACAATTACTG CAACTGACAA AGAGACAGAC GAGCCTGCAA AAAATGTGAC ATTTCTCATT 
GGATTGTTCC ATAGCAATGA GATGATTTTC AGAAACTACT TTTTCACAGA AAATGGTGTT 
TTACCAATAA CTGTACTATC ACAACAAGGA TATGATAATT TTGTAATTAA TGGAGAGCAA 
GATTCACTTT TGGGAGCATA TCATGCAACT GAATCATCTC CAATAGAGAT TGCAGGCCCC 
GTCTTTGATT CAGGTGGATT GTTTACTTTT GAGATTGAAG TTAGAACCAT TGATGAGCCA 
ACTAACATCA TAGAAGATTC AGGTGTATAT CGTGCAGATT TGACACTTGT TGAAACCACT 
TCTCATCCTC AAGAAGATAC TGAAGGAAAT GATGTAGAAT TTAGAATGAA ATCTTATTTT 
GATAAAATCC AAAATTTCCA ATATGATCCT GCAACAAAAC AAGTAACTTT TGAGATGCCT 
TTTGATTGGA GTGAGAACAG CATGTCTCAC GTTACAGTTG TGCACGAAGA AGTACATTTT 
CCAAAACATT TCATTGAATT TTTGAGTCCT AGTTATTCAG GATACGCAAA TGGAATTGAG 
TTGTTCAAAG CTTCAGTATC AATTGATGAT TACACAGAAG AAGATGAGAG AATAGTTCAC 
TTTGTTTTAT TGCAAGACCA TCTAAGATTC ATAAAAAATG AGATGAAAAA ATCTGATGAG 
CCACTACCAG ACAATATTGT TTTCACTTTA ACTACAAATG AAAAAATATC ATTTCCATTA 
GAGGCATTTA CAAAGAGTGA AGACTTCAAA GTAAACTTGT CATGGGATCC TATAGATCTT 
GAACCAGGAG TTGAAACAAA CTTTGTCTTT ACTATTAGAG ACGGATGGAC AAATGAACCT 
TTAAGAAATT CTGATTATTC TTTTGTAATC ATTCAAAATG GAGCGGAGTT ATACCGGGTA 
TCTGGAACTG CAACAGTTGG TGGTGAATTT GAAAAATTCA CATTTGCTGA AGACCAAACA 
GGTCCTACAA CAATTAAATT TGAAAACATA CGAAATACTG GACAAGAAAC TGAGTTTGGA 
ATAATGGTTG CACCTGAATT TGGTACTATT GCAATTTTGA TACTTGTTGT TTCTATAATT 
GGAATAATTG TAATTGCCAG AAAATATGAG ACTTTTTCTC TCATTAGGAT GTAA

Protein sequence

MMSITKLSIL ALAACLLFPA SSVYGHGLGI DTISSVDVAG KEISISVEMP MYFESEQEQI 
TITATDKETD EPAKNVTFLI GLFHSNEMIF RNYFFTENGV LPITVLSQQG YDNFVINGEQ 
DSLLGAYHAT ESSPIEIAGP VFDSGGLFTF EIEVRTIDEP TNIIEDSGVY RADLTLVETT 
SHPQEDTEGN DVEFRMKSYF DKIQNFQYDP ATKQVTFEMP FDWSENSMSH VTVVHEEVHF 
PKHFIEFLSP SYSGYANGIE LFKASVSIDD YTEEDERIVH FVLLQDHLRF IKNEMKKSDE 
PLPDNIVFTL TTNEKISFPL EAFTKSEDFK VNLSWDPIDL EPGVETNFVF TIRDGWTNEP 
LRNSDYSFVI IQNGAELYRV SGTATVGGEF EKFTFAEDQT GPTTIKFENI RNTGQETEFG 
IMVAPEFGTI AILILVVSII GIIVIARKYE TFSLIRM