Gene Sterm_3201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3201
Symbol
ID	8598654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	3353488
End bp	3354900
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	36%
IMG OID
Product	Beta-glucosidase
Protein accession	YP_003309973
Protein GI	269121796
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.281249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGA AAATAGTATT TCCTGAGGAT TTTTGGTGGG GCTCAGCATG GTCCGCAGAA 
CAGTCGGAAG GAACAGGGGA TACCGGAAAA GCAGAAACTA TATGGAAACG CTGGTTTAGC 
GAAGAACCAA ACAGGTTTTA TGACAGAATA GGACCAGATG TAACTACTGA TCATTTTAAC 
CGTTACAAGG ATGACATAAG ACTTATGAAA GAAACAGGGC ATAATTCTTT CAGACTTTCC 
TTATCATGGG CACGTTTATT TCCTGACGGA GGAAGAGGAG AAATAAACAG AAAAGCTGTT 
GATTTTTACA GGGACTTAAT GAGTGAAATG ATAAAAAATG ATATAAAGCC CTTTATAAAT 
CTATATCACT TTGATATGCC GATGAAATTA CAGGAGCTGG GAGGCTGGGC ATCACGTGAA 
ACAGTGGAAG CTTATGTTAA TTATGCAGTT TCATGCTTTA AGGAATTTGG TGATCTTGGT 
TATCACTGGT TTACATCCAA CGAACCTCTC GGTCCTATTT TAGGAACATA TCTCGAAGAC 
TTTCATTATC CGAATTTTAT AGATTTTAAA GAAGGAGCAC AGGCAGCTTT TTACACAATA 
CTGGCACATG CAAAGGCTAT AAAAGAATTT AAGAAGCTGA ATTTGAAGTC AAAAATAGGA 
GTTATATTAA ACCTTAGTCC TACATATCCG AGAAGCAGCA ATAAATGGGA TACAGAAGCA 
GCAGAAACCG CAGATGCATT TTATACCAGA AGCTTTCTTG ATCCTATGGT AAAAGGGACT 
TTTAATAAAA AACTGGTATC TATACTGAAA GAATACGATC AGATGCCTGA TTATACAGAG 
GAAGATCTGA AAATAATATC TGAAAATACT GCACAGATTC TGGGGCTTAA TTATTATGAG 
CCGAGAAGGG TGAAAGCCAG ATTAACAGCT GTTAATAAAA ACAGTCCTTT TCTGCCTGAA 
TGGTTTTTTG AACTTCATAA TATGCCCGGA AAGAGAATGA ATATATACAG AGGCTGGGAA 
ATATATGAAA AAGGAATTTA TGATTTATGT ATGGATATAA AGGAAAACTA CGGCAATATA 
GAATCATTTA TTTCTGAAAA CGGAATGGGA GTAGCAGATG AAGAGAGATT TCTCGGAGAA 
AACGGACAGA TTATTGATGA ATACAGAATA AATTATATAA AAGACCATCT GGCATATCTG 
TATAAAGCAG TAAATGAAGG ATGCAATATA AAGGGATACC ACCTGTGGAC ATTTATAGAC 
TGCTGGTCAT GGATAAATGC ATATAAAAAC AGATACGGGC TCGTTTCGCT GGATCTTGCT 
ACACAAAAAA GAACAATAAA AAAGAGCGGG GAATTTTTTA AAAAGATGAC GGAAGAAAAC 
GGCTTTCTAT ATGATACTGA TAAGTTAGTA TAA

Protein sequence

MEKKIVFPED FWWGSAWSAE QSEGTGDTGK AETIWKRWFS EEPNRFYDRI GPDVTTDHFN 
RYKDDIRLMK ETGHNSFRLS LSWARLFPDG GRGEINRKAV DFYRDLMSEM IKNDIKPFIN 
LYHFDMPMKL QELGGWASRE TVEAYVNYAV SCFKEFGDLG YHWFTSNEPL GPILGTYLED 
FHYPNFIDFK EGAQAAFYTI LAHAKAIKEF KKLNLKSKIG VILNLSPTYP RSSNKWDTEA 
AETADAFYTR SFLDPMVKGT FNKKLVSILK EYDQMPDYTE EDLKIISENT AQILGLNYYE 
PRRVKARLTA VNKNSPFLPE WFFELHNMPG KRMNIYRGWE IYEKGIYDLC MDIKENYGNI 
ESFISENGMG VADEERFLGE NGQIIDEYRI NYIKDHLAYL YKAVNEGCNI KGYHLWTFID 
CWSWINAYKN RYGLVSLDLA TQKRTIKKSG EFFKKMTEEN GFLYDTDKLV