Gene Sterm_1723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_1723
Symbol
ID	8597192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	1841819
End bp	1843183
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	37%
IMG OID
Product	sulfatase
Protein accession	YP_003308512
Protein GI	269120335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTT TATACATACA CACACATGAT TCCGGAAGAT TTTTGAAACC GTACGGATAT 
AACGTGCCGA CTGACTATTT ATTGGAATTT GCCAAGGATG CCGTTGTTTT CAGAAAGGCA 
TTCTGCGGGG CACCGACATG TTCGCCCAGC CGGTCAGTCC TGCTGACAGG AATGTATGCA 
CATAATAACG GTATGCTGGG GCTTGCTCAC AGAGGTTTTA AAATAAATGA TTACAGCAAA 
CACCTTGCAA GCTACCTGAA AAATTATGAT TATGAAACTG TTTTATCCGG TGTACAGCAT 
GAGGCAGATT CTTGGCTGAA TTATGATAAA GCTGCAAAGG TAATAGGCTA CAGCTGTGAT 
ATTACTACTG TGCCTGAAAA AGACAATGAA GAAGAGCTTG TTTACTGGGA CAGAAATAAT 
GCTGCCGAAA CAGCAGAATA CTTTAAGAAA GCTGCTAAAA CCGATAAGAA ATTTTTTATG 
TCATTTGGTA TGTTCAGTAC TCACAGAAAA TATCCCGTCA TTCCGGAAAA TAATACTGAT 
CCTGATTATG TAGAGTTGCC GCCGAGAACT TATGATAATG AAAATAACAG GGCGGATACT 
GCCAGATACA TGGATTCGGC AAGGATGGCA GATGATTGCA TAAAAACTGT AATAGAGGCA 
TTAAAAGATG CAGGACTTTA TGAAAAGACA ATAATAATCT TTACTACCGA TCATGGTGTA 
GCCAATCCGT TTGACAAATG TTTTTTGAAT GACAGCGGAA TAGGAGTAGC TTTGATAATC 
AGAGATCCGA ATCAGAAGAA ACAGGGAAGA GCAATAGATG CTATGGTTTC GCATATTGAT 
ATTTTCCCCA CACTGTGTGA GCTGACAGGA GTGGAGAAGC CGGAGTGGCT TCAGGGGAAA 
TCACTGGTTC CCCTTCTTTA TGAAAATAAA AAGGTAAGGG AAGAGATATA TGCAGAGATT 
AATTATCACA CATCATATGA ACCTGCAAGA TGTGTAAGGA ATGAAAGATA TAAATATATA 
AAGTATTTTG ATAAGACATA TGACAAATAT AACTATTCCA ATATGGATGA TTCCGAAGTA 
AAAGGATTTC TCATGAAAAA TGGTCTTTTG GATATGAAAA AAGAAATGGA AATACTTTAT 
GATCTGTACT TTGATCCGGG TGAAAGCAAT AATGTAGCAG GAAAAGCTGA ATACAGCGAA 
ATTCTTGAAG AAATGAGAAT AAAGCTTCAA AAGTGGCAGA AGCAAACTGA TGATCCTGTG 
CTGGAAGGAA GAATAAAAGC ACCTGAAGGA GCAAAAATAA ATAATAAAGA GTGTATGTCA 
GCTGGTTCTA AAAATAAAAA TGACTACGAA AAGTTTCCGG ATTAA

Protein sequence

MNILYIHTHD SGRFLKPYGY NVPTDYLLEF AKDAVVFRKA FCGAPTCSPS RSVLLTGMYA 
HNNGMLGLAH RGFKINDYSK HLASYLKNYD YETVLSGVQH EADSWLNYDK AAKVIGYSCD 
ITTVPEKDNE EELVYWDRNN AAETAEYFKK AAKTDKKFFM SFGMFSTHRK YPVIPENNTD 
PDYVELPPRT YDNENNRADT ARYMDSARMA DDCIKTVIEA LKDAGLYEKT IIIFTTDHGV 
ANPFDKCFLN DSGIGVALII RDPNQKKQGR AIDAMVSHID IFPTLCELTG VEKPEWLQGK 
SLVPLLYENK KVREEIYAEI NYHTSYEPAR CVRNERYKYI KYFDKTYDKY NYSNMDDSEV 
KGFLMKNGLL DMKKEMEILY DLYFDPGESN NVAGKAEYSE ILEEMRIKLQ KWQKQTDDPV 
LEGRIKAPEG AKINNKECMS AGSKNKNDYE KFPD