Gene Tbis_2402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_2402
Symbol
ID	9168906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	-
Start bp	2800341
End bp	2802041
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	68%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003652999
Protein GI	296270367
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.951994
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGCAC GATGGCCGGT CGCCCTGACC GTACTGGTCT TTCTGTGGGC CGTCGGCGCA 
TGCGGCGCCG CGCCGCCCTC GGGCGGACGT GACGGCACGC CGCTGCCCTC TCCCGTCAAA 
GCTCTCGACA TCAACCAGGT CGCCCGGGAC AAGGTGAAGA ACGGCGGCAC GCTGCGCTGG 
GGGCTGAGCG ACTTCCCCAC GCAGTGGAAC TACAACCACG CCGACGGCTC CCTGGCGAAC 
GTCAAGGTCG TCATCTCCGC GCTGCTGCCG CGGGTCTTCC GGTCCGACGA GCGGGGACGC 
CTCTCCCTCG ACACCGACTA CGTCACCAAC GCGCGGATCA CGGCGACCTC GCCGAACCAG 
GTGATCACCT ACACCATCAA CCCGAAGGCC CGGTGGTCCG ACGGCAAGCC GATCACCTGG 
GAGGACTTCG CCGCCCAGTG GAAGGCCATG AGCGGCCGGG ACGGCGGCTA CCGGGCCGAC 
TCGTCCATCG CGTACGAGAA CATCAAGAGC GTGGCGCGCG GGTCGAGCGA CCGCGAGGTG 
GTCGTCACCC TCGCCGAGCC GTTCAACGAG TGGCAGTCGC TCTTCACCCC GCTCTACCCG 
CGCTCGACCA ACGCGTCGCC GGACGAGTTC AACTCCGGCT GGATCAACCG GATCCCGGTC 
ACCGCCGGGC CGTTCCAGGT GGAGAAGTTC GACGCCAAGG GCAAGACGAT CACGCTCGCC 
CGGTCGCCGC AGTGGTGGGG CAACCCGGCG AAGCTCGACC GGATCGAGTT CCGGCACGTC 
CAGCCGACCA CCATGCTGCG GGCCTTCACC AAGGGCGAGA TCGACGTGTT CGACATCGGC 
CCGTCCCCGG AGAACTACGC CGCGGTGCGG GAGGTCTGGG ACGCGGTGGT CCGGCAGGCC 
GCGGGCCCCG AGTACCGCCA GCTCACCTTC AACGGGGAGA GCGAGGTGCT CTCCGATCTC 
CGCGTGCGGC AGGCGATCGC GCTCGCCATC GACCGCAAGG CGATCATGGA GATCGACCTC 
AAGGGGCTCG GCTGGCCGAT CGTCACCCTC GACCACCACT TCCTCATGAA CAGCCAGTAC 
GGGTACCGGA GCAACGCCGG CGCCCACGGC GCCTACGACC CCAAGCGCGC CGCCCGGCTG 
CTCGACGAGG CCGGCTGGAA GCTGTCCGGG AAGGTGAGGT CGAAGAACGG CAAGCCGCTC 
CGGCTGCGGT TCGTGGTTCC CGCCGGGGTG CGGGTGACCG AGACCCAGGC CCAGGTGGTG 
CGCCTCATGC TCCAGAAGAT CGGCGTGCAG GTGGACGTGG CGCGGGTCCG CTTCCAGGAC 
TTCTTCACCA AGCACCTGCT GCCCGGCAAG TTCGACATCA CCGCCTTCTC CTACCCGAGC 
TCGCCGTTCC CGATCTCCAG CGCCTACGAC ATCTACGCCA ACGGGGAGCC CGGCCGGGGC 
GACGAGGTGA AGTGGTACTC CAACCTGGGG CGAAGCGGGA GCAGCGAGAT CGACCAGGCG 
ATGTACGACG CGGGGAGCAC GCTCGACCAG AAGGAGGTCA TCGAGCTGAT CCACGCCGCC 
GACGCCCTGA TCTGGGAGAA GGTCAACGTG CTGCCCCTCT ACCAGGTCCC GCAGAACGTC 
GCGGTCCGGT CCACGCTCGC CAACGTGGGC GCCAACGGCT TCTACGACCT GCGGTACGAG 
GACATCGGGT ACGTGTCGTG A

Protein sequence

MRARWPVALT VLVFLWAVGA CGAAPPSGGR DGTPLPSPVK ALDINQVARD KVKNGGTLRW 
GLSDFPTQWN YNHADGSLAN VKVVISALLP RVFRSDERGR LSLDTDYVTN ARITATSPNQ 
VITYTINPKA RWSDGKPITW EDFAAQWKAM SGRDGGYRAD SSIAYENIKS VARGSSDREV 
VVTLAEPFNE WQSLFTPLYP RSTNASPDEF NSGWINRIPV TAGPFQVEKF DAKGKTITLA 
RSPQWWGNPA KLDRIEFRHV QPTTMLRAFT KGEIDVFDIG PSPENYAAVR EVWDAVVRQA 
AGPEYRQLTF NGESEVLSDL RVRQAIALAI DRKAIMEIDL KGLGWPIVTL DHHFLMNSQY 
GYRSNAGAHG AYDPKRAARL LDEAGWKLSG KVRSKNGKPL RLRFVVPAGV RVTETQAQVV 
RLMLQKIGVQ VDVARVRFQD FFTKHLLPGK FDITAFSYPS SPFPISSAYD IYANGEPGRG 
DEVKWYSNLG RSGSSEIDQA MYDAGSTLDQ KEVIELIHAA DALIWEKVNV LPLYQVPQNV 
AVRSTLANVG ANGFYDLRYE DIGYVS