Gene BURPS668_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1168
Symbol
ID	4883080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1145722
End bp	1146939
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	71%
IMG OID	640127096
Product	benzoate transporter
Protein accession	YP_001058217
Protein GI	126439232
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3135] Uncharacterized protein involved in benzoate metabolism
TIGRFAM ID	[TIGR00843] benzoate transporter

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCC AGCCGCCCGC CTCCAACCTG CCGCGCGCCG CCGCGCGAGC GAATTTTTTC 
ACCGACACGT CGCCGTCCGC GCTCGTCGCG GGCTTCGTCG CGATGATGAC GGGCTATACG 
AGCTCGCTCG TGCTGATGTT CCAGGCCGGC CGCGCCGCGC ACCTGAGCGA CGCGCAGATC 
TCGTCGTGGA TCTGGGCGCT GTCGATCGGC ATGGCCGTGA CGACGATCGG GTTGTCGCTG 
CGGTATCGCG CGCCGATCGT CGTCGCGTGG TCGACGCCCG GCGCGGCGCT CCTTGTCGCG 
TCGCTGCCCG GCGTCGCGTA TTCGGACGCG ATCGGCGCGT TCGTCGTCTG CGCGCTGCTG 
CTCGCCGCCG TCGGCGCGAG CGGCCTGTTC GACACGCTGA TGCGCCGGAT TCCGTCCGGC 
ATCGCCGCGG CCCTCCTCGC CGGCATCCTG TTCGAGATCG GCATCGAGAT CTTCCGCGCC 
GCGCAGTTCC AGACCGCGCT CGTGCTCGCG ATGTTCTTCA CGTACCTGAT CGTCAAGCGC 
GCGGCGCCGC GCTATGCGAT CGTCGCGACG CTCGCCGCGG GCGTCGCGGC TGCGGGCGCG 
CTCGGCCTGC TCGACTTCGG CCGCTTTCAC GTCGCGCTCG CGCGGCCCGT GTTCACGGCG 
CCGTCGTTCT CGATCCCGGC GATCGTGAGC ATCGGCATTC CGCTGTTCGT CGTCGCGATG 
GCGTCGCAGA ACGTGCCCGG CATCGCGGTG CTGCGCGCGG ACGGCTACGC CACGCCGTCG 
TCGCCGCTCA TCGCGACGAC GGGCATCGCG TCCGTCGTGC TCGCGCCGTT CGGCTCGCAC 
GGAATCAACC TCGCCGCGAT CACGGCCGCG ATCTGCACCG GCCCCGAGGC GCACGACGAT 
CGCGCGAAGC GCTACACGGC GGCCGTCTGG TGCGGCACGT TCTATCTCGT CGCGGGCGTG 
TTCGGCGCGA CGATCGCCGC GCTCTTCGGC GCGTTGCCGA AGGCGCTCGT CGTATCGGTG 
GCCGCGCTCG CGCTGTTCGG CTCGATCATG AGCGGCCTCA CCAACGCGAT GCAGGACGCG 
CGCCAGCGCG AAGCCGCGCT CGTCACGTTC ATGGTGACCG CTTCCGGCCT CACGCTGCTG 
TCGATCGGCT CGGCATTCTG GGGGCTCGTG GCGGGCGTGC TCACGCAAGC GATCCTCAAC 
GCGCGCCGCA CCGCCTGA

Protein sequence

MSSQPPASNL PRAAARANFF TDTSPSALVA GFVAMMTGYT SSLVLMFQAG RAAHLSDAQI 
SSWIWALSIG MAVTTIGLSL RYRAPIVVAW STPGAALLVA SLPGVAYSDA IGAFVVCALL 
LAAVGASGLF DTLMRRIPSG IAAALLAGIL FEIGIEIFRA AQFQTALVLA MFFTYLIVKR 
AAPRYAIVAT LAAGVAAAGA LGLLDFGRFH VALARPVFTA PSFSIPAIVS IGIPLFVVAM 
ASQNVPGIAV LRADGYATPS SPLIATTGIA SVVLAPFGSH GINLAAITAA ICTGPEAHDD 
RAKRYTAAVW CGTFYLVAGV FGATIAALFG ALPKALVVSV AALALFGSIM SGLTNAMQDA 
RQREAALVTF MVTASGLTLL SIGSAFWGLV AGVLTQAILN ARRTA