Gene Sterm_0130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_0130
Symbol
ID	8595626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	136661
End bp	138166
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	37%
IMG OID
Product	sulfatase
Protein accession	YP_003306946
Protein GI	269118769
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAA TAATCATATT TTTTGACAGT CTGAACAGGC ATTTTCTTCC GAATTACGGT 
AATGACTGGG TTAATGCCCC TAATTTCAAA AGACTGGATG AAAAAACACT TACTTTTGAC 
AGAAGTTATG TAGGGAGTAT GCCCTGTATG CCTGCAAGAA GAGAACTTCA TACCGGAAGA 
CATAATTTTC TCCACAGAGA ATGGGGACCT TTGGAGCCTT TCGATGATTC AATGCCGGAA 
ATTCTGAAAA AAGCCGGAGT TTATACTCAT ATGATAACAG ACCATTTTCA TTACTGGGAA 
GACGGCGGTG CCACTTTCCA TAACAGATTT TCCTCATATG AAATGATCAG GGGACAGGAA 
GGGGACCACT GGAAAGGTGA AGCAGAATAC AAAGAAGATA AAGAATTTTT AAGCATTCCC 
GAACCGCACA GCGGCAGCGG AAAAGTTTCT TCCTTATGGA GATATGACAG GATTAACAGA 
AAATATATGG ATACAGAGGA AAAACAGCCC CAAAGTAAAG TTTTTTCTCT TAGCTGTGAA 
TTTATAGAAA AAAACAGCTC CTATAATAAC TGGCTTCTGC ATATAGAAAC ATTCGATCCC 
CATGAACCGT TTTTTGTAAA AGACAAATAT CTGGAACAGT ACAAAGATAC TTACAGCGGA 
CCTGAATTTG ACTGGCCCAG AGGTGAGGTC AAAGAATCTC CGGAAGCTGT GGAACATATA 
AGAAAAAAAT ATGCTGCTCT GGTTTCCATG TGTGATAAAA ATCTGGGAAT GATTCTTGAT 
TTAATGGATA AACACAATAT GTGGGAAGAT ACTATGCTGA TCGTGGGAAC AGACCATGGT 
TTTCTTCTCG GAGAGCACGG ATGGTGGGGA AAAAATCTTA TGCCGTATTA TAATGAAATA 
GCAAATACAC CTTTATTTAT ATGGGACCCA AGGTCAAAAA AGAAAAATGA AAGAAGAAAT 
GCTATTGTGC AGATGATAGA CTGGGCCCCG ACATTGCTTG ATTACTTTGA TGTTGCCATT 
CCGGAAACAA TGAAAGGAAA ATCTCTGAAA GAGACTATAG AAACCGATGT TCCTGTCCGC 
AAGGAATGTA TTTACGGAGT TCACGGAGGA CATGTAAATA TGTATGACGG AAATTATACC 
TATATGAGAG CACCTGCATT CAAAGAAAAC AAACCGCTCT ATAATTATAC ACTTATGCCT 
ATGCATATGA ATAAGCTTTT TAGTGTTGAT GAAATAAAAG ATGCCGAGCT TTCAGAGCCG 
GTAAATTATT CCAAGAATGT TCCGGTATTA AAATTTCGTG CGGAAGATAA ATATAAAATA 
TATAAATATG GTACTTTAAT ATTCGATATC AATAATGATC CGAAACAGCT TTACCCTGTA 
AAAGATAAAG CTCTGGAACA GAACCTTACG GAAAAACTGA TTAAAAATAT GGAATTTCAC 
GAGTCGCCAA AGGATCAATA TACAAGACTC GGACTAAATA TGCCTAAGGA GAAGAAAAAT 
GTATAA

Protein sequence

MKAIIIFFDS LNRHFLPNYG NDWVNAPNFK RLDEKTLTFD RSYVGSMPCM PARRELHTGR 
HNFLHREWGP LEPFDDSMPE ILKKAGVYTH MITDHFHYWE DGGATFHNRF SSYEMIRGQE 
GDHWKGEAEY KEDKEFLSIP EPHSGSGKVS SLWRYDRINR KYMDTEEKQP QSKVFSLSCE 
FIEKNSSYNN WLLHIETFDP HEPFFVKDKY LEQYKDTYSG PEFDWPRGEV KESPEAVEHI 
RKKYAALVSM CDKNLGMILD LMDKHNMWED TMLIVGTDHG FLLGEHGWWG KNLMPYYNEI 
ANTPLFIWDP RSKKKNERRN AIVQMIDWAP TLLDYFDVAI PETMKGKSLK ETIETDVPVR 
KECIYGVHGG HVNMYDGNYT YMRAPAFKEN KPLYNYTLMP MHMNKLFSVD EIKDAELSEP 
VNYSKNVPVL KFRAEDKYKI YKYGTLIFDI NNDPKQLYPV KDKALEQNLT EKLIKNMEFH 
ESPKDQYTRL GLNMPKEKKN V