Gene Nmar_0094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0094
Symbol
ID	5773141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	+
Start bp	82664
End bp	83803
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	32%
IMG OID	641315713
Product	hypothetical protein
Protein accession	YP_001581432
Protein GI	161527606
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0992132
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGGAA CAAAAATTGT TGTTTATGGC CTTAGTACAG AAGGATACGC CATTGCATCA 
CAAATGGCCA TTAAAGGAGC AGATGTTTAC ATAATTGACG AATCAACCCC ATCTGCAATT 
TCATTAAAAG CAGAGATTGC TAAAACATAT CCTAATGTTT CATCTCTAAA AGAAGATGAG 
CCATTATTAG CTATGGAGCC AATTGAAGTA GCAATTTCTA AAGCTCAATA CTTGTTTTTT 
ACCCCAAGAA TTAGAAAAAC TGGACAAGAT ATCAAAACTG AAATTCATTC AAAATTCAAG 
GACGCTACTG CATCTTTAAA GAAAAAGAGC TCTGTTGTTT TTACTCTTCC TACAGGATTT 
GGTGGAAATA ATGAAAACAT TTCTTTACTT GAACATGTTA CAGGATTAGA AGTCGGAAAG 
GATATTTCAT ATTTTTATTA TCCTTTGGAA GGTATTGAAC AACAACCAAA AATTATTGGT 
TCCTTTAATG GTAAAAAAGA CTCTGTACTA TCTGATTTAC TAACTACCGG AAAAAAAGAG 
AAAAACTTTG TTGCGATTTC ATCTTCTGAA CATTTTCATG CAATCAATGT ACTCTCAAGA 
TTTTCAAGCT TGTGTAGTGT ATTGGAAGTT TGTAAATATG CTCAAGATGA AATTACTAAA 
AATGATCTAT CTTCTGATGA TTTTCAAGAA ATATTCCTTG ATGACATGGT AGGAGGTTTA 
CTGGATCTAA AATCTTTAGG CTCATCTTTT GAAGGTGCAA ATACACTCAT GTATCTAATT 
AATGGTAGTG TCAAGGGAAT TGATGGTTAC ATCAAACGAT TAATTGATGA AATTCGTGCA 
ACATTGAAGA AAAATGATCT TAAAGCTAGT AGAACTAAAA TCGCATTATC TTGGACACTT 
GATCAACATT CAATGCGAGG AGATAAAATT GAAATGCTAC AAAATCTAAC TTCTAGATTA 
CGTGATTATA TTGGTGATGT AGAAGCATAT GAAGATCCAA ACTTTGATCT ATTTCATAGT 
GATAAAACAA CAATTGTTGT GGCTTGCTCA AAATCTGATT TTACAAATAT TGAAAAAACT 
AAACAAGATT CTGATTTAAT TATTGTCAAA GCAAACCCTC TATGCGAAAC AATTCAATAA

Protein sequence

MGGTKIVVYG LSTEGYAIAS QMAIKGADVY IIDESTPSAI SLKAEIAKTY PNVSSLKEDE 
PLLAMEPIEV AISKAQYLFF TPRIRKTGQD IKTEIHSKFK DATASLKKKS SVVFTLPTGF 
GGNNENISLL EHVTGLEVGK DISYFYYPLE GIEQQPKIIG SFNGKKDSVL SDLLTTGKKE 
KNFVAISSSE HFHAINVLSR FSSLCSVLEV CKYAQDEITK NDLSSDDFQE IFLDDMVGGL 
LDLKSLGSSF EGANTLMYLI NGSVKGIDGY IKRLIDEIRA TLKKNDLKAS RTKIALSWTL 
DQHSMRGDKI EMLQNLTSRL RDYIGDVEAY EDPNFDLFHS DKTTIVVACS KSDFTNIEKT 
KQDSDLIIVK ANPLCETIQ