Gene BTH_I1735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_I1735
Symbol
ID	3849330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007651
Strand	+
Start bp	1943186
End bp	1944214
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	637841404
Product	beta-hexosaminidase
Protein accession	YP_442270
Protein GI	83721329
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0532306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGC CCCCCGGTCC GGTGATGCTC GACGTCGTCG GCACGACGCT CACGCGTGAC 
GACGCGCGCC GTCTCGCGCA TCCACAGACG GGCGGCGTGA TTCTGTTCGC GCGCCACTTC 
GAAAGCCGCG CGCAGCTCGT CGCGCTGACC GACGCGATCC GGGCGATCCG CGACGACATC 
CTGATCGCGG TCGATCACGA GGGCGGCCGG GTGCAGCGCT TTCGCACCGA CGGCTTCACC 
GTGCTGCCGG CGATGCGCCG GCTCGGCGAG CTGTGGGACA AGGATGTGCT GCACGCGACG 
AAGGCGGCGA CCGCGACGGG CTACGTGCTC GCGTCCGAGC TGCGCGCGTG CGGCATCGAC 
ATGAGTTTCA CGCCCGTGCT CGACCTCGAC TACGGCCGCT CGAAGGTGAT CGGCGATCGC 
GCGCTCCATC GCGATCCGCG CGTCGTCGCG CTGCTTGCGA AGAGTCTGAA TCACGGGCTT 
GCGCTTGCCG GGATGTCGAA CTGCGGCAAG CATTTTCCCG GTCATGGCTT CGCTGAGGCC 
GATTCGCACG TCGCGCTGCC GATCGACGAT CGCCCGCTCG ACGAGATCCT CGCGAACGAT 
GCGGCGCCGT ACGACTGGCT CGGGCTGTCG CTGTCGGCCG TCATTCCGGC GCACGTGATT 
TACACGCAGG TCGATTCGAA GCCGGCGGGC TTCTCGCGCG TATGGCTGCA GGACGTGCTG 
CGCGGCCGGC TGCGTTTCCC GGGCGCGGTG TTCAGCGACG ATCTGTCGAT GGAAGCCGCG 
CGCGAAGGCG GCACGCTCGC GCAGGCGGCG CAGGCCGCGC TCGATGCGGG CTGCGACATG 
GTGCTTGTGT GCAATCAACC GGATGCGGCG CAGCGGGTGC TCGACGAGCT GCGCACGACG 
ACGTCGCACG AATCGCTGCT GCGGATCAAG CAGATGCGCC CGCGCGGCAA GGCGCTCAAA 
TGGCGCAAGC TGATGCGTGA GCCGCGCTAT CTGAGCGCGC AGGAACTGTT GCGCAGCACG 
TTCGCTTGA

Protein sequence

MKLPPGPVML DVVGTTLTRD DARRLAHPQT GGVILFARHF ESRAQLVALT DAIRAIRDDI 
LIAVDHEGGR VQRFRTDGFT VLPAMRRLGE LWDKDVLHAT KAATATGYVL ASELRACGID 
MSFTPVLDLD YGRSKVIGDR ALHRDPRVVA LLAKSLNHGL ALAGMSNCGK HFPGHGFAEA 
DSHVALPIDD RPLDEILAND AAPYDWLGLS LSAVIPAHVI YTQVDSKPAG FSRVWLQDVL 
RGRLRFPGAV FSDDLSMEAA REGGTLAQAA QAALDAGCDM VLVCNQPDAA QRVLDELRTT 
TSHESLLRIK QMRPRGKALK WRKLMREPRY LSAQELLRST FA