Gene Nmar_0595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmar_0595
Symbol
ID	5774192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosopumilus maritimus SCM1
Kingdom	Archaea
Replicon accession	NC_010085
Strand	-
Start bp	531812
End bp	533020
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	33%
IMG OID	641316229
Product	glycosyl transferase family protein
Protein accession	YP_001581929
Protein GI	161528103
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATAG CATTTGATGT TTTGAATTAT TCATTATCAG CAATCCTAAT TGGAATATGT 
GGAGCGTGGT TATTTTTGAT AAAATCAATG GTTGATTCAT TTAGATTAAC ACCTTACTTG 
GATAGATTTG AAAATACATC AAAGGGATTT CCCAAAGTTT CAATAATTTT ACCTGCAAGA 
AACGAAGAAG AGTTTCTTGG AAAATGTTTG GATTCATTAA TTGATCAGGA TTACAAAGAT 
TATGAAATTA TTGTAATTGA TGATTCATCA GAAGATTCTA CGGGAAAAAT AATTTCAGAA 
TATGCAAAGA AAAACTCCAA AGTCATTCAT GTTTCTGCAA GAGAAAAACC TGAAGGATGG 
ATGGGAAAAA ACTGGGCATG TATGGAAGGA TATAGAAAAG CAACAGGAGA ACTATTGTTA 
TTTACAGATG CAGACACTAC ACATAAAAAA AATGTCATAT CACTTGCGGT CTCACATCTT 
TTATCATTTG AACTAGATGC ATTATCAACC ATACCAAAAA TGCTCACATT TGATTTTTGG 
ACAAACATTA CCCTTCCAAT GATTTCTACG TTTTTGCATA CAAGATTCTC TGCACTAAAT 
GTGAACAATC CATCAAAAAA GACAGGTTAT TTTTTTGGTA GTTTTTTCAT TTTGAAGAAA 
AGTACGTATG AACAAGTTGG TATGCATGAG GGAGTCAAAC ACGAAATAAT TGAAGATGGG 
GCACTTGGAA AAAAAGTAAA GGAAGCAGGA TACAAAATGA AGATGGTAAG AGGAGAACAT 
CTAGTAGAAG CAGTTTGGGC AAGAGACAAA AGTACCCTTT GGAATGCACT AAAAAGATTG 
ATGATACCTT TGTATCTTCA AAGTGGGAAA ATCGCAATAG GAATTTTCTT TGCAGTATTG 
TTTTTGCTTT TTGTACCATT TCCAATTTTT GCAACATCTA TTTTGTTACC TGCAGAAACA 
TTATCATCAA AAATTCTTTG TGCAACGGCG TTTGCAGCAT CATTGTTAAT TTACATTGGA 
GCAGTGATTG AAGCCAAAAT AGGATTAGAA TTAAAATTTA GATATGCAAT ATTTGCTCCA 
CTTGGAAGCC TTGTAGTTGT GTTAGGATTT TTGAGTGGAT TATTGCAAGC TAAAAAAACA 
TCATCAGTTA CTTGGAGGGG AAGGAGTTAC TCTATGAAAG ATCACTCTCA AAGTTCGATT 
AGCGTATAG

Protein sequence

MEIAFDVLNY SLSAILIGIC GAWLFLIKSM VDSFRLTPYL DRFENTSKGF PKVSIILPAR 
NEEEFLGKCL DSLIDQDYKD YEIIVIDDSS EDSTGKIISE YAKKNSKVIH VSAREKPEGW 
MGKNWACMEG YRKATGELLL FTDADTTHKK NVISLAVSHL LSFELDALST IPKMLTFDFW 
TNITLPMIST FLHTRFSALN VNNPSKKTGY FFGSFFILKK STYEQVGMHE GVKHEIIEDG 
ALGKKVKEAG YKMKMVRGEH LVEAVWARDK STLWNALKRL MIPLYLQSGK IAIGIFFAVL 
FLLFVPFPIF ATSILLPAET LSSKILCATA FAASLLIYIG AVIEAKIGLE LKFRYAIFAP 
LGSLVVVLGF LSGLLQAKKT SSVTWRGRSY SMKDHSQSSI SV