Gene Sterm_3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3345
Symbol
ID	8598797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	3519845
End bp	3521170
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	37%
IMG OID
Product	glycoside hydrolase family 4
Protein accession	YP_003310116
Protein GI	269121939
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAA TTAAAATTGT AACTATTGGC GGAGGTTCCA GCTACACACC GGAACTGATT 
GAGGGATTTA TTAAGAGAAG TGCGGAGCTT CCAATAAGGG AAATTTGGCT TGTTGACATA 
GAAGAGGGGA AAGAGAAGCT TGAAATAGTG GGGAATCTGG CAAAACGTAT GGTAGAAAAA 
GCTGGACTGG ACTGGCAGAT ACATCTGACT CTGGACAGAG AAGAAGCTTT GAAAGGTGCT 
GATTTCGTAA CAACACAATT CAGGGTTGGT TTCCTTGATG CTCGTATAAA AGATGAAAGA 
ATACCTTTTG AAAATGGTCT GCTTGGTCAG GAAACAAACG GTCCCGGCGG AATGCTGAAA 
GCATTTCGTA CAATTCCGGT AATTCTTTCT ATAGTTGAAG ACATGAAAAG ACTTTGTCCT 
GATGCATGGC TCGTAAACTT TACAAATCCG GCAGGAATGG TAACAGAAGC AGTATTGAAG 
TATGGGAAAT ATGAAAAAGT GGTGGGACTG TGCAATGTTC CTGTAAACCA TATGATGAGC 
GAATCAAAGC TTCTTGGCAA GGATGCCAGT GAATTGTTTT TCCACTTTGC AGGATTAAAC 
CACTTTGTAT GGCACAAGGT ATATGATAAT AAAGGTAATG ATATAACAGG AGAAGTAGCT 
GCGAAAGTAA TAAGCGAAGA AGAAGCAGGA GTGGCTAATA TAGAAGTAAT GCATTTTCTT 
CAGGATCAGC TTGATCACTT AGGAATGATA CCGTGTTATT ATCACAGATA CTATTATCTT 
CAGGACGATA TGCTTCAAAA AGGACTTGAA AGCTATAAAA ATGAAGGAAC TCGTGGTGAA 
GTGGTAAAAA GAGTGGAAGA AGAATTATTT GAACTATATA AAAATCCAGA CTTAAAAGAT 
AAGCCTACAC AGCTTGAAAA AAGAGGAGGA GCATATTATT CAGATGCTGC ATGTGAATTG 
ATAAATTCAA TACATAATGA CAAAAAAATA TTAATGGTAG TAAATACGCG TAATAACGGA 
ACAATAGATG ATCTTCCTTA TGACTGTGCT ATAGAAACTA CTGCATATAT AACTGCATCC 
GGTCCAAGAC CTCTTAATTT CGGGAAATTT CCTACTGCAC AAAGAGGATA TATCCAGATA 
ATGAAAGCAA TGGAAGAACT TACAATAGAA GCGGCTGTAA CTGGAGATTA TAAAATAGCA 
TTAGAAGCAT TCATTACTAA TCCTTTAGTA CCTGGAAGCA CTATCGGTAA AAAGGTATTA 
GATGAATTAT TAATAGCTCA CAAAAAATAT CTTCCTCAGT TTAAAGATTT TTTTGACAAA 
CAATAG

Protein sequence

MSKIKIVTIG GGSSYTPELI EGFIKRSAEL PIREIWLVDI EEGKEKLEIV GNLAKRMVEK 
AGLDWQIHLT LDREEALKGA DFVTTQFRVG FLDARIKDER IPFENGLLGQ ETNGPGGMLK 
AFRTIPVILS IVEDMKRLCP DAWLVNFTNP AGMVTEAVLK YGKYEKVVGL CNVPVNHMMS 
ESKLLGKDAS ELFFHFAGLN HFVWHKVYDN KGNDITGEVA AKVISEEEAG VANIEVMHFL 
QDQLDHLGMI PCYYHRYYYL QDDMLQKGLE SYKNEGTRGE VVKRVEEELF ELYKNPDLKD 
KPTQLEKRGG AYYSDAACEL INSIHNDKKI LMVVNTRNNG TIDDLPYDCA IETTAYITAS 
GPRPLNFGKF PTAQRGYIQI MKAMEELTIE AAVTGDYKIA LEAFITNPLV PGSTIGKKVL 
DELLIAHKKY LPQFKDFFDK Q