Gene Tbis_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_1010
Symbol
ID	9167497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	+
Start bp	1138102
End bp	1139361
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	66%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003651626
Protein GI	296268994
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.227353
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGG ACTTCGTCAA CGACCCAGCG TTCCTCCGCG GCATGACCAC CCGCCGGATC 
GGCCGCCGGG ACGCGTTCCG GCTGGCCGGG CTCTCCGCCG CCGGCCTCGC CCTCGCCGCC 
TGTGGCGTGC AGGGCAAGGG CTCGCCGCGG CCGACCACCT CCGCGCAGGT CCAGTCGGAG 
GTGGAGAAGT ACTGGTCGGG CAAGGTCAAG AACGGCCACG TCAACTTCGC GAACTGGCCG 
CTCTACATGG ACCCCAAGCG GCCCGAGCTG AAGAAGTTCA CCGAGCGGAC CGGCATCACG 
GTGACCTACA AGGAGGTCAT CCAGGACAAC CCGAGCTGGT TCGCCAAGAT CCAGCCGCTG 
CTCGCCGCCG GGCAGTCGAT CGACTACGAC CTGATGGTCG TCACCAACGG GGTCCACTTC 
ACCCAGCTCG TGCGGCTCGG CTACCTGGTC CCGCTCGACC ACTCCAAGCT CCCGAACTTC 
GCGGCGAACG CGGCGGAGCG GTACAAGAAC GAGTCCTTCG ACCCGGGGAA CGTCTACAGC 
ATCCCGTGGG CGTCCGGCAT GACCGGCATC GCCTACAACC CGAAGTACGT CGACACCCCG 
CCGACGAAGA TCGCCGACCT GTGGAACCCC AAGTACAAGG GGAAGGTCGG CATGATGGCC 
GACGCCCAGG AGATCGCCAA CTTCGGCCTG CTGCTGCTCG GCATCAAGCC CGAGACGTCG 
ACCCCGGACG ACTGGGAGAA GGCGGCGGAG AAGCTCCGGG AGCAGCGGGA CTCCGGCATC 
GTCCGGAAGT ACTACGACCA GTCGTACATC GACCCGCTCG CCAAGGGCGA CATCTGGCTC 
ACCATGGCGT GGTCGGGCGA CGTCTTCCAG AAGAACATCT CCGACGGCAC GGACCTGCGG 
TTCGTCATCC CCGAGGAGGG GGCGACGATC TGGACCGACA ACATGGTGAT CCCGAAGACC 
GCGGAGAACC CGGTCGACGC CATCATGTTG ATGGACTTCT TCTACGAGGT GGAGATCGCG 
GCCAGCCTCG CGGAGTACAT CAACTACGTC ACCCCGGTGC CCGCCGCCCA GGAGGTCGTC 
CGGAAGCACG CCGCCGAGGC GACCGGTGAG GACAAGCGGC TCCTCGAGCA GCTGGCCGAG 
AGCCCGCTGG TGTTCCCGTC CGAGGAGGAC TACGCGAAGC TGCACGACTA CCGCAACTTC 
ACCAGCACCG AGGAGCAGCA GAAGTTCGAG CACATCTTCC AGGCGATCAC CACATCATGA

Protein sequence

MNKDFVNDPA FLRGMTTRRI GRRDAFRLAG LSAAGLALAA CGVQGKGSPR PTTSAQVQSE 
VEKYWSGKVK NGHVNFANWP LYMDPKRPEL KKFTERTGIT VTYKEVIQDN PSWFAKIQPL 
LAAGQSIDYD LMVVTNGVHF TQLVRLGYLV PLDHSKLPNF AANAAERYKN ESFDPGNVYS 
IPWASGMTGI AYNPKYVDTP PTKIADLWNP KYKGKVGMMA DAQEIANFGL LLLGIKPETS 
TPDDWEKAAE KLREQRDSGI VRKYYDQSYI DPLAKGDIWL TMAWSGDVFQ KNISDGTDLR 
FVIPEEGATI WTDNMVIPKT AENPVDAIML MDFFYEVEIA ASLAEYINYV TPVPAAQEVV 
RKHAAEATGE DKRLLEQLAE SPLVFPSEED YAKLHDYRNF TSTEEQQKFE HIFQAITTS