Gene BURPS668_3175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3175
Symbol
ID	4881882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3115933
End bp	3117288
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	72%
IMG OID	640129103
Product	4-hydroxybenzoate transporter
Protein accession	YP_001060187
Protein GI	126439396
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00895] benzoate transport

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.902434
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGG CGGCGAATCC CGCGCGCGTG CTCGAAATCG AGCGCGTGAT CGACGACACG 
CACCGGCCCG CGTTTCACGC GATGCTGCTC GCGCTTTGCG GGCTGTGCCT CGTGATCGAC 
GGTTTCGACG CGCAGGCGAT GGGCTACGTC GCACCGAGCG TGATCGCCGA ATGGGGTGTG 
AAGAAGCAGG CGCTCGGGCC CGTCTTCAGC GCGAGCCTGT TCGGCATGCT GCTCGGCGCG 
CTCGGCCTGT CGGTGCTCGC CGATCGGATC GGCCGGCGGC CCGTGCTGAT CGGCGCGACG 
CTGTTCTTCG CGCTCGCGAT GCTCGCGACG CCGTTCGCGA CGTCGATCCC GATATTGATC 
GCGCTGCGCT TCGTCACGGG CCTGGGGCTC GGCTGCATCA TGCCGAACGC GATGGCGCTC 
GTCGGCGAAT GCAGCCCGGG CGCGCACCGC GTGAAGCGGA TGATGATCGT GTCGTGCGGC 
TTCACGCTCG GCGCGGCGCT GGGCGGGTTC GTCAGCGCCG CGCTGATTCC CGCGTTCGGC 
TGGCGCGCGG TGTTCTTCGT CGGCGGCGCG GTGCCGCTCG CGCTCGCGGC CGCGATGGCC 
GCGAGCCTGC CCGAATCGCC GCAGTCGCTC GTGCTGCGCG GCCGGCACGA CGCGGCGCGC 
GCGTGGCTCG CGAAGTTCGC GCCGCGGCTC GCGGTCCCGC CCGATACGCG GCTTGTCGTG 
CGCGAAGCGG GACCCCGGGG CGCGCCCGTC GCCGAGCTGT TCCGCTCGGG ACGCGCGCGC 
GTCACGCTGC TGTTGTGGGC GATCAACTTC ATGAACCTGA TCGACCTGTA CTTCCTGTCG 
AACTGGCTGC CGACCGTGAT GCGCGACGCG GGCTACGCGA GCGGCACGGC CGTCATCGTC 
GGCACGGTGC TGCAGACGGG CGGCGTGATC GGCACGCTGT CGCTCGGCTG GTTCATCGAA 
CGGCATGGTT TCGCGCGCGT GCTGTTCGCG TGCTTCGCGT GCGCGACGAT CGCGATCGGC 
CTGATCGGCC CGGTCGCGCA CGCGTTCGTC TGGCTGCTCG CAGCCGTGTT CGTCGGCGGC 
TTTTGCGTCG TCGGCGGACA GCCCGCGGTC AATGCGCTCG CGGGCCATTA TTACCCGACG 
TCGCTGCGCT CGACGGGCAT CGGCTGGAGT CTCGGCGTGG GCCGCGTCGG CTCCGTGCTC 
GGGCCGCTCG TCGGCGGGCA ACTGATCGCG CTCGGCTGGT CGAACGACGC GCTGTTTCAC 
GCGGCGGCCG TGCCGGTGCT GTGCTCGGCC GTCTTCGTGA TCGGCCTCGC GAGCGTGACG 
CGGCGGCGCG GCACGGCCGC GCCGAACGTC GCTTGA

Protein sequence

MSAAANPARV LEIERVIDDT HRPAFHAMLL ALCGLCLVID GFDAQAMGYV APSVIAEWGV 
KKQALGPVFS ASLFGMLLGA LGLSVLADRI GRRPVLIGAT LFFALAMLAT PFATSIPILI 
ALRFVTGLGL GCIMPNAMAL VGECSPGAHR VKRMMIVSCG FTLGAALGGF VSAALIPAFG 
WRAVFFVGGA VPLALAAAMA ASLPESPQSL VLRGRHDAAR AWLAKFAPRL AVPPDTRLVV 
REAGPRGAPV AELFRSGRAR VTLLLWAINF MNLIDLYFLS NWLPTVMRDA GYASGTAVIV 
GTVLQTGGVI GTLSLGWFIE RHGFARVLFA CFACATIAIG LIGPVAHAFV WLLAAVFVGG 
FCVVGGQPAV NALAGHYYPT SLRSTGIGWS LGVGRVGSVL GPLVGGQLIA LGWSNDALFH 
AAAVPVLCSA VFVIGLASVT RRRGTAAPNV A