Gene Nmag_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmag_1352
Symbol
ID	8824185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natrialba magadii ATCC 43099
Kingdom	Archaea
Replicon accession	NC_013922
Strand	-
Start bp	1385643
End bp	1387289
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	63%
IMG OID
Product	sulfatase
Protein accession	YP_003479493
Protein GI	289581027
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGAGG AATCAGCAGC CGAGTCTAAC GGACGTGAAT CGGAGTCACA TTCAACAGCC 
AGGAACGTGG TTCTCGTCGT ACTCGATACG GCACGTGCGA GGAGTGTCGG CGAGTGGCCG 
ACCACGGACG CAAGTTCGAA CGATCCAGCC GAAGACGACC CAGACGAGCG CCACGATCCG 
ACCCAACCAA CACCGACGCT GTGTCGGCTC GCCGAAACTG GCACCGTTTT CGAGAACGCG 
TTTGCGACGG CTCCGTGGAC ACTTCCCTCC CACGGCTCGA TGTTCACCGG CCTGTATGCC 
TCCGAACACG GCACGCACGG CGGGCACACG TTCCTCGATC CGGAACTTCG AACGCTTCCC 
GAGGCGTTCG CCGACGCCGG CTACGAGACC GTCGGTATCT CGAACAACAC CTGGATAACC 
GAGGAGTTCG GCTTTGACCG CGGTTTCGAC GACCTCCGGA AAGGATGGCA GTACATCCAG 
TCCGACGCCG ACATGGGGGC CGTCGTCCGG GGTGAGGATC TGCGCGAAAA GCTCCAGGCG 
ACCCGGAACC GACTGTTCGA CGGCAATCCC GTCGTCAACG CGGCGAACAT CCTCTACAGC 
GAAGTCCTGC AGCCATCGGG TGACGACGGT GCCGCCCGCT CTGCGGACTG GGTCGACGGC 
TGGCTCGGCG ACCGCGACGA CGACAAGCCG TTCTTCCTCT TCTGTAACTT CATCGAACCC 
CACGTCGAGT ACGACCCGCC GCAAGAGTAC GCAGAACGCT TCCTCCCCGA GGACGCGACC 
TACGAGGAGG CGACCGCGAT CAGACAGGAC CCCCGCGCCT ACGATTGCGA GGACTACGAA 
ATCACCGAGC GTGAGTTCGA ACTGCTCCGT GGCCTCTACC GCGCCGAACT CGCCTACGCC 
GACGCCCAGG TTGGTCGTCT CCGGGAGGCA CTCGAGTCCC ACGGCGAATG GGAGGATACC 
CTCTTCGTGG TCTGTGGCGA CCACGGCGAG CATATCGGCG AACACGATTT CTTCGGCCAC 
CAGTACAACC TGTACGATAC GTTGATCAAC GTGCCGCTGG TCTGTCACGG GGGGCCGTTT 
ACTGACGCCG ATTTCGAGTC CGGAAGTGGA ACCGAAACTG GAACTGAATC CGGAACCACC 
ACTGACGATG TGACGGGTAC CCACCGCGAC GACCTCGTCC AACTGCTCGA CCTGCCGCTC 
ACACTCCTCG ACGCCGTCGG TGTTTCTGAT CCCGAACTGC GGGAACAGGG AAGCGGGCGC 
TCACTCCACC CCGCGTCGGA CGACGATCCG AGAGACGCTG TCTTCGCCGA GTACGTCGCC 
CCACAGCCGT CGATCGACCG GCTCGAAGCC CGATTCGGCG ATATTCCGGA CCGCGTCCGC 
GAGTTCGACC GCCGACTTCG TGCGATTCGG ACACACGAGT ACAAGTACGT CCGTGGCGAC 
GACGGCTTCG AACGGCTCCA TCACGTCCCG ACCGATCCAG CCGAGCAGTC GAACCTCGTC 
CAGGCCGAAC CCGACACCGT CAGCGCGCTC CAGGAGCAAC TCGAGGAGCG CTTCGATCCG 
CTGGCCGAGT CGGAACCCGA CTCGACGGAC GAGGTGGCGA TGCGAGAGGG GACGAAAGAG 
CGACTGGCTG ATCTCGGTTA TCTGTAA

Protein sequence

MAEESAAESN GRESESHSTA RNVVLVVLDT ARARSVGEWP TTDASSNDPA EDDPDERHDP 
TQPTPTLCRL AETGTVFENA FATAPWTLPS HGSMFTGLYA SEHGTHGGHT FLDPELRTLP 
EAFADAGYET VGISNNTWIT EEFGFDRGFD DLRKGWQYIQ SDADMGAVVR GEDLREKLQA 
TRNRLFDGNP VVNAANILYS EVLQPSGDDG AARSADWVDG WLGDRDDDKP FFLFCNFIEP 
HVEYDPPQEY AERFLPEDAT YEEATAIRQD PRAYDCEDYE ITEREFELLR GLYRAELAYA 
DAQVGRLREA LESHGEWEDT LFVVCGDHGE HIGEHDFFGH QYNLYDTLIN VPLVCHGGPF 
TDADFESGSG TETGTESGTT TDDVTGTHRD DLVQLLDLPL TLLDAVGVSD PELREQGSGR 
SLHPASDDDP RDAVFAEYVA PQPSIDRLEA RFGDIPDRVR EFDRRLRAIR THEYKYVRGD 
DGFERLHHVP TDPAEQSNLV QAEPDTVSAL QEQLEERFDP LAESEPDSTD EVAMREGTKE 
RLADLGYL