Gene Tbis_3512 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_3512
Symbol
ID	9170044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	-
Start bp	4099650
End bp	4101392
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	68%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003654093
Protein GI	296271461
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.290938
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAGCC GAGTGCGGTT GCTGATACCG CTCCTCGCGG TCGGCCTCCT GACGGCGTGC 
ACGGGCGGGG CCGAGACGCC CGCGCGATCC CCGGCACCGG CGGCCGCCGC GGTGCCGGGC 
GGAGAATCGC TCCCCCGGCA CGAGACCCTC TACACCAGCG GCACGCAGTG GGGGCCACCG 
GCGAACTGGA ACCCGCTCCG GGAATGGGAC TTCGCCACCG GGACGAAGGG CCTCGTCTAC 
GAGACCCTCT TCCTCTACGA CCCGAGCATC GACCGGCTCA TCCCGTGGCT CGCCGAGAGC 
GGCTCCTGGA CCGGGGAGAA GGAGTACACC CTCAAGCTCC GGAAGGGCAT CACCTGGGCG 
GACGGCGAGC CGTTCACCGC CGAGGACGTG GTCTTCACCT TCGAGCTCGG CAAGCTGGAG 
ACCGTCCCCT ACCACCAGCT CTGGGAGTGG CTGGCGCGGG CCGAGGCGGT GGACCAGCAC 
ACGGTCAGGT TCACCTTCAC TGAGGCCAAC CACCAGGAGT GGTCGACCCA CCTCTACAGC 
CGGGCGATCG TGCCCAAGCA CCTGTGGGAG GTCCGGTCCG AGGAGGAGGT GATGAACGGC 
GCCAACGAGA ACCCCATCGG CACCGGGCCG TACGCCTACC ACTCGCACGA CCAGGACCGC 
ATGGTCTGGG TGCGCCGGGA CGGCTGGTGG GCGACCAAGG TGATCGGCAA GCGGGTCGCG 
CCCAAGTACA TCGTGGACAT CGTCAACTCG AGCAACGAGG TGGCGATGGA CTGGCTGCTC 
CAGAAGCACC TCGACCTGAG CAACAACTTC CTCCCGGGCG TCGCCAACCT GGTCACCGGT 
GACTTCGGCC TCCAGACCTA CTACAACCGG CCGCCGTACA TGCTCGCCGC GAACACGGCC 
TGGCTGGTGA TGAACACCAA GAAGAAGCCG ATGGACGACC CGGTGTTCCG GAGGGCGCTC 
GCCCACGCCA TCGACACCAG GAAGATCGTC GAGGGCGTGT ACCAGAACCT GGTGCAGGCG 
GCGAACCCGA CCGGGCTCCT CCCGCAGTGG AGCAAGTACA TCGACCAGGA CGTGGTGAAC 
CGGCTCGGCT TCTTCTACAG CCCGGCCAAG GCGAAGGAGC TGCTCATCGA CGCCGGCTAC 
CGGGACCGGG ACGGGGACGG CTTCATGGAG TCGCCCAGCG GGGCGAAGAT CGCGCTCAAG 
ATCGCCGTGC CGGCCGGGTG GACCGACTGG ATGGAGGCCG CCCGGGTGAT CAGCGAGGGC 
GCCAAGGGGG CCGGGATCAA CCTCGAGCCG GAGTTCCCCG ACTACAACGC GCTCGTCGAC 
GCCCGCAACT CCGGCAAGTT CGACATGGTC CTCAACAACG ACCGCCAGCT CGCCAGCACC 
CCGTGGCGGT ACTACGACTT CATCTTCCGC CTGCCGGTGC GCAAGCAGCA GACCACGGCG 
AACTTCGGCC GGTACGAGAA CAAGCAGGCC TGGCGGCTGG TCCGGGAGCT CGACGGCGTC 
CGGACCGACG ACGTCGAGGG GATGAAGCGG ATCATCTCCC GGCTCCAGGA GATCCACCTC 
CGGGAGATGC CGATCATCCC GCTCTGGTAC AACGGGCTGT GGGCGCAGAT GACCAGCGCG 
GTCTGGACGA ACTGGCCGTC CGAGGCGATG GGAGCCCCCA AGCACGCTCC GAGCATGTGG 
CGGGACTGGA TGGAGATGGG CGGCCTCCTC ATGCTGACCG AGCTCCGGCC GGCGGCGGGC 
TGA

Protein sequence

MRSRVRLLIP LLAVGLLTAC TGGAETPARS PAPAAAAVPG GESLPRHETL YTSGTQWGPP 
ANWNPLREWD FATGTKGLVY ETLFLYDPSI DRLIPWLAES GSWTGEKEYT LKLRKGITWA 
DGEPFTAEDV VFTFELGKLE TVPYHQLWEW LARAEAVDQH TVRFTFTEAN HQEWSTHLYS 
RAIVPKHLWE VRSEEEVMNG ANENPIGTGP YAYHSHDQDR MVWVRRDGWW ATKVIGKRVA 
PKYIVDIVNS SNEVAMDWLL QKHLDLSNNF LPGVANLVTG DFGLQTYYNR PPYMLAANTA 
WLVMNTKKKP MDDPVFRRAL AHAIDTRKIV EGVYQNLVQA ANPTGLLPQW SKYIDQDVVN 
RLGFFYSPAK AKELLIDAGY RDRDGDGFME SPSGAKIALK IAVPAGWTDW MEAARVISEG 
AKGAGINLEP EFPDYNALVD ARNSGKFDMV LNNDRQLAST PWRYYDFIFR LPVRKQQTTA 
NFGRYENKQA WRLVRELDGV RTDDVEGMKR IISRLQEIHL REMPIIPLWY NGLWAQMTSA 
VWTNWPSEAM GAPKHAPSMW RDWMEMGGLL MLTELRPAAG