Gene Sterm_2095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_2095
Symbol
ID	8597560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	2222860
End bp	2224644
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	36%
IMG OID
Product	sulfatase
Protein accession	YP_003308880
Protein GI	269120703
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTG TAATGTTAAT GTTTGATACA TTAAACAGGA GAAGTCTGTC AGCTTACGGG 
AATAAATGGA TAAAAACACC TAATTTTGAC AGGCTGGCAG AAAAAACAGT AATGTTCAAT 
AATTTTTTTT CGGGAAGTCT GCCGTGTATG CCTGCAAGGA GGGAACTGCA TACAGGAAGA 
TACAATTTTT TACACAGAAG CTGGGGACCT ATGGAGCCGT TTGATTTTTC CATGCCGGAA 
ACATTAAAAA ATAACGGGAT ATATACACAT CTGGTGACAG ATCATTCACA TTATTTTGAA 
GACGGAGGTG CTACCTATCA TAACAGATAT AATACCTGGG AAGGCTTTCG GGGGCAGGAG 
GGCGACCGCT GGAAAGGAAA GATAGGGGAT ATTGATATTC CGGAACAGAT AGAAACCGGA 
AAAAAAGGAA TATCTTTTAA GCAAAACTGG ATAAACAGAA ATTATCAGAA AAATGAAGAA 
GAATTTTCGG GAACAAAGGT AATAAATGCA GGAATAGAAT TTATTACAGA GAACATAAAT 
GAAGATAAGT GGTTTTTGCA GATAGAATGC TTTGATCCTC ATGAGCCGTT TTATTCACCG 
GAAAAATATA AAGAGCTGTA TAAGCATGAA TATAACGGAA AATTTTTTGA CTGGCCTTCA 
TATAAACCGG TAACTGAAAG TGAAGAAGAA ATAGAGCATC TTAATTATGA GTATGCTGCA 
CTGCTCAGCA TGTGTGATGC ACAGCTTGGC AAGGTTCTGG ATACTATGGA TAAATACAAT 
ATGTGGAAAG ATACAATGCT GATAGTAAAT ACAGATCACG GGTTCTTACT TGGAGAGCAT 
GGCTGGCTGG GAAAAAATAT GGAGCCGGTA TATAACGAAG TAGCGCATAT TCCGTTTTTT 
ATCTGGGATC CGAGATTTGA AATAAAAAAT GAAACAAGAA ATTCACTGGC TCAGACAATA 
GATCTTCCGG CAACAATATT AGAATATTTT AATGTAGAAC TTCCTGAAAC AATGCAGGGA 
AAACCGCTGA GAAAGGCTAT AGAAAAAAAG GAGGATATCA GAAAAGCAGG TTTGTTCGGC 
ATATACGGTG GGCATATAAA TGTAGTAAAT AATGAGTATA TTTATATGAG AGCTCCGATA 
TGTCCTGAAA ACACTCCTTT GTATGAATAT ACCCTAATGC CGGCAAAAAT GAGAGGATTT 
TTCAGCAAGA AACAGCTGGA AAATACAGAA TTAGTGAATG GATTTAAGTT TACAAACGGA 
ATAAGCGTTC TAAAAACCTT CGGAGAACTG GAATCCTCGC TTTACAGATT TGGAAATAAA 
TTATTTCACA GAAAAAATGA TCCGCTTCAG GAAAAAAATC TGGATAACAT AGAGGCAGAG 
GAAAAGCTGA CAGAAATAAT GCGGGAGCTG ATGCTCGAAT CAGAAGCTCC GGATGAGCAG 
TATGAGAGAA TAGGAATCTA TAAAGACAGA AAAATTACCG CAGAAGAATT AACGGTTCAG 
AAAGAAGCAC GAATAAAACG TGAAAAATCA GGTATAAATG AAAATATAAT TATTTCTGAT 
AAAGTTCTTG CCCAGATAAA CATAATCAAA GGAATTATAA GAAATAAAGA AGACAGGAAA 
TATTTCCTGA AGGAAATAAA CAGCATGTAT GAAGAAAAAA AAGTGATGGA ACTGAAAGAG 
GAGGATATAT TAAAGATTGC AGACAGTGTA ACCGGGAAGC TGAATCTCGG GGATAAAAAG 
AAAGTTTTAA TGGATAGTAT AAAATATGCC GATGTAAAAG AATAA

Protein sequence

MKVVMLMFDT LNRRSLSAYG NKWIKTPNFD RLAEKTVMFN NFFSGSLPCM PARRELHTGR 
YNFLHRSWGP MEPFDFSMPE TLKNNGIYTH LVTDHSHYFE DGGATYHNRY NTWEGFRGQE 
GDRWKGKIGD IDIPEQIETG KKGISFKQNW INRNYQKNEE EFSGTKVINA GIEFITENIN 
EDKWFLQIEC FDPHEPFYSP EKYKELYKHE YNGKFFDWPS YKPVTESEEE IEHLNYEYAA 
LLSMCDAQLG KVLDTMDKYN MWKDTMLIVN TDHGFLLGEH GWLGKNMEPV YNEVAHIPFF 
IWDPRFEIKN ETRNSLAQTI DLPATILEYF NVELPETMQG KPLRKAIEKK EDIRKAGLFG 
IYGGHINVVN NEYIYMRAPI CPENTPLYEY TLMPAKMRGF FSKKQLENTE LVNGFKFTNG 
ISVLKTFGEL ESSLYRFGNK LFHRKNDPLQ EKNLDNIEAE EKLTEIMREL MLESEAPDEQ 
YERIGIYKDR KITAEELTVQ KEARIKREKS GINENIIISD KVLAQINIIK GIIRNKEDRK 
YFLKEINSMY EEKKVMELKE EDILKIADSV TGKLNLGDKK KVLMDSIKYA DVKE