Gene Sterm_4075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_4075
Symbol
ID	8599519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	4341002
End bp	4342405
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	37%
IMG OID
Product	glycoside hydrolase family 1
Protein accession	YP_003310838
Protein GI	269122661
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCATA AGAGAATAGA AAAATTTCCT GATGACTTTC TTTTTGGAGC AGGAACATCG 
TCTTTTCAGG TAGAGGGCGG AATAAAAGAA GGCGGGCGCG GAATTGCCGT GCATGATCTG 
AAAAAACCGA AAAAAGGAAT AACTGATTTT TCAGTTGCCA GCGATCATTA TCACAGATTT 
GAAGAAGATA TTGAGTTAAT GAAGGAGCTG GGACTGAATT CTTATAGATT TTCAATATCA 
TGGGTAAGAA TTCTTCCTGA CGGGAAAAAT ATAAATAAAG AGGGGCTGGA TTTTTATAAC 
AGACTGATTC AAAAATTAAC AGATTCAGGT ATAGAGCCTA TTGTTACAAT TTATCACTTT 
GAATATCCGA AGGCACTTGT GGATAAATAC AAAGGCTGGT TATCCAGAGA AAGTATAGAG 
GATTATGTTA ATTTTGCCGG AATATTGTTT AGCAATTATG GCGACAGGGT TAAATACTGG 
CTGACGATCA ACGAGCAGGA TCATCTTTTG AAAATACCTG AGCGTATAGG GTTTCCTGCG 
GAAATGACAG GGCTTGAATA TGAACGGAAT GCACAGACAG CTAATTATAA CATGTGTGTC 
GCAGCTGCCA AAGTAACAGA ATTATGCCAT AAAATGATTC CCGGTGCCAA AATTGCTCCT 
ATTATAAATC CTATGCCGGC AATTCCGGCA AGCAATCTTC CTGATGATCT TATAGCCTCA 
ATGGAATTTA ACGAATTATC TGCATATTAT ATGCTTGATT TAAACTGCCG GGGAAAATAT 
TCGCCTGTTT ATCGTAAATA TCTGGAAGAC AGGGATATTT TTCCGGAGAT AAATGATGAT 
GATATGAAGC TGATGAAAGA TAATCCTCCG GATTTTATAG CAGTAAATTA TTATATGAAT 
CAGACAATAG CCGTGAGCAG TATCAAAGAA ATCGCCCTTA GAGGGAAAGA GGTTTTTGTT 
TCGGAAGAAG TGGGAATCTA CAAAATAGCT AAAAATGAAT ATATTCCGCA GACAGACTGG 
GGGTGGAATA TATGTCCTGA AGGGCTGAAA ATAGCAATAA TGGAAATATA TAACCGTTAT 
CAGCTGCCCA TGCTTATCAC TGAAAACGGA CTCGGAGCCT ATGATAAGCT GGAAAACGGA 
GAGATACACG ACAGCTATCG TATAGACTAC ATAAGCAGAC ATTTAAGCCA GGTGAAGGAT 
TGTATAAGTC TGGGATTTCC TGTTTTTGGA TATTATGCAT GGTCATTTAT TGATTTGGTC 
AGCGGCAGAG AAGGTATGGA TAAGCGTTAT GGATTTGTTT ATGTAAACAG GGATAATGAT 
GATTTAAAAG ATTTGAGCCG TATAAAAAAA GACAGTTATT ATTGGTATAA AAAAACAATT 
GCAGAAAGAG GACAAGATCT GTAA

Protein sequence

MYHKRIEKFP DDFLFGAGTS SFQVEGGIKE GGRGIAVHDL KKPKKGITDF SVASDHYHRF 
EEDIELMKEL GLNSYRFSIS WVRILPDGKN INKEGLDFYN RLIQKLTDSG IEPIVTIYHF 
EYPKALVDKY KGWLSRESIE DYVNFAGILF SNYGDRVKYW LTINEQDHLL KIPERIGFPA 
EMTGLEYERN AQTANYNMCV AAAKVTELCH KMIPGAKIAP IINPMPAIPA SNLPDDLIAS 
MEFNELSAYY MLDLNCRGKY SPVYRKYLED RDIFPEINDD DMKLMKDNPP DFIAVNYYMN 
QTIAVSSIKE IALRGKEVFV SEEVGIYKIA KNEYIPQTDW GWNICPEGLK IAIMEIYNRY 
QLPMLITENG LGAYDKLENG EIHDSYRIDY ISRHLSQVKD CISLGFPVFG YYAWSFIDLV 
SGREGMDKRY GFVYVNRDND DLKDLSRIKK DSYYWYKKTI AERGQDL