Gene BURPS1710b_A0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0059
Symbol
ID	3693635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	85752
End bp	87509
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	71%
IMG OID	637730312
Product	thiaminase I precursor
Protein accession	YP_335217
Protein GI	76818592
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.234303
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCGC ATCGACAAAC ACCAAGACAA GCGCATCGTT TCGCACGCGT CATTCGACAA 
GGAACCATCA TGCGTCGCCT CTTGTGCTGC TTCACGATCG TTCTGGGCTT CCTGTTCGCC 
GCGCCGTCGC ACGCGGGCGA CGCGGCCGCC GTTGGGCAAC TGACGGTGGC GCTGTATCCG 
TGGGTGCCGC GCGTCGACCA GTTCAAGCGC GCGATCGAAA CCGAATGGAA GAAGGCGCAG 
CCGGGCGTCG CGCTGCGGTT CATATCCGCG GACGCGTGGG ACGGCGGCTA CCGGAACGAT 
CCGCCCGCGA GCGCCGACGT CTACGTGTAC GACGCGATCT TCCTCGACTA TTTCCGCAGC 
CAGAACTGGC TCGAGCCGCT CGCGGCGGAC GAGATCCAGC ACATCGACGA TTTCCTGCCG 
TACGCGATCC AGGGCGTGAA GGCGGGCGAC CGGTACTACA GCATCCCGCA GCTCGGCTGC 
GCGAACGTGC TGTTCTACCG GAAGGACGAC GCGGCGCTCG CGGCCGCGAC GACGCTCACG 
CAGGTGCGCG GCGCGCTCGA GCAATGCACG TTCACGAGCG AGATCCCGCC GGACAGGCGC 
GGGCTGATGG TCGACATGTC CGGGCGCACG ACGAACGCCG CGCTCTATCT GGACGCCGCG 
CACAGCCGCA CGGGCGCATA CCCGCTGCCG CTGCCGTGGA ACGCGAACGA CCTGAACGGC 
GAAGCGCTCG GCAGCCTGCG CGCGCTGATG GCGATGTCGA GCTGGCCGAA CGCGACAGCC 
GAGCTGCCGG GCCAGTACGA TCGCTCGGTA TGGTTCAGCG ACGGCGAAGG GCGCGCGGTG 
ATCGGCTATT CGGAATCGAT GTCGGCGATG AGCGAGGCGG CGCGGCGCGA TCTCGACTTC 
AAGTTCCTGC CGCTGTCGGA CACGCCGCAG CCGCCGCTCT TCTACGCGGA CGTGATCGGC 
GTGAACACGA CGACCCACGC GCGCGGCACG CGCGCGCTCG CGGTGCAACT CGCGAACGTG 
ATCGCCGCAT CGTCGACGAT GGTGCAAAGC GTCGGGCCGG ACGGCAGCGG CGTGCCGCAA 
TATCTGTTCT CCGCGCGGCG CAGCGTGCTG CACACGCTCG CGCAGCGCTA TCCGCTCTAT 
CGGAAGATGG TCGCGCTGCT GGATGCGCGC GAGCCGGTGA TGTTCAAGAT CGATGCGCAG 
TCGCGCAACT GGCTCGCCTC GATGAGCGGG CCGATCGCGC AGCGCGCGCG CGCCCGATTA 
CCCGTGCGGC TGCGATATCG ACACCGCGCT GCCGATCGCC GACTATCGCG GCGCGCAGGC 
CGTGTGCCCG ACCGTCTGCG CGGCGCAGGG CGGCTGGAAC GGCCAGTGGA CCAATCAGTC 
TCCCGCGGCG CCCGCCGGGC AGTCGGCGTG CGGCTGCAAC GCGTGCCCGA CGTCAGCCGC 
GGCGAAACTG CCGCGCGCGC TCGCCACCCG CGCCGCGCCC GGCGATCGCG CGAAGCCGTG 
ACACGGGCGG CGCCCGGCCT CGCCGCGGGC GGGCCGGGAG CCCGGCCCGC GAGGCCCGCG 
CCGCGCCCGA ATCGCCTCGC GCGCGGTCGA ACGCGGTTGC GCAACGGCCG CGCCGCAACC 
GGCCGGCCTC TCGAACGCGC GGCATGCGGC CCGTGCGATC CGCGTATGAG GCCGAGCCGT 
CCGATAGCGG GCGGATACGC GCCGCCCCGA CCGTCGACGG CCGGCTCGGG CCCGCCCGTT 
CGCGCGAGCG GGCGCTAG

Protein sequence

MRAHRQTPRQ AHRFARVIRQ GTIMRRLLCC FTIVLGFLFA APSHAGDAAA VGQLTVALYP 
WVPRVDQFKR AIETEWKKAQ PGVALRFISA DAWDGGYRND PPASADVYVY DAIFLDYFRS 
QNWLEPLAAD EIQHIDDFLP YAIQGVKAGD RYYSIPQLGC ANVLFYRKDD AALAAATTLT 
QVRGALEQCT FTSEIPPDRR GLMVDMSGRT TNAALYLDAA HSRTGAYPLP LPWNANDLNG 
EALGSLRALM AMSSWPNATA ELPGQYDRSV WFSDGEGRAV IGYSESMSAM SEAARRDLDF 
KFLPLSDTPQ PPLFYADVIG VNTTTHARGT RALAVQLANV IAASSTMVQS VGPDGSGVPQ 
YLFSARRSVL HTLAQRYPLY RKMVALLDAR EPVMFKIDAQ SRNWLASMSG PIAQRARARL 
PVRLRYRHRA ADRRLSRRAG RVPDRLRGAG RLERPVDQSV SRGARRAVGV RLQRVPDVSR 
GETAARARHP RRARRSREAV TRAAPGLAAG GPGARPARPA PRPNRLARGR TRLRNGRAAT 
GRPLERAACG PCDPRMRPSR PIAGGYAPPR PSTAGSGPPV RASGR