Gene BURPS1106A_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0220
Symbol
ID	4901384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	205489
End bp	206778
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	72%
IMG OID	640133450
Product	major facilitator family transporter
Protein accession	YP_001064503
Protein GI	126455134
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTGTAC CACCCGGCGC GCCGCGGCCC GCCGCCGCCG GCCGAGCGAA CTCGGCGCAT 
GCCGCGCAAG GCGCGTCGCC CGTCGGCGCC GCCCCATATC TCGAGCGCGG CTCACGCGGT 
TACTGGCACG CGAGCGTCGC GCTGCTGTTC GCCGGTTACG CGACGTTCTC GCTGCTCTAT 
TACGTGCAGC CGCTGTTGCC GGAATTCTCG AAGGCATTCG GCGTGAGCCC CGCGCAGAGC 
AGTCTCGCGC TGTCGTTCGC GACGGCCGCG CTCGCCGCCG CCGTGTTCGT CGCCGGCTTC 
GTCTCCGAAG CGTTGAGCCG CCACCGGCTG ATGACGGCTT CGCTCACCGC TTCGTCGCTG 
CTCACGCTCG CCGCCGCATT CGCGCCGCAC TGGCATCAAC TACTGATCCT GCGCGCGCTC 
ACGGGGCTCG CGCTCGGCGG CGTGCCCGCC GTCGCGATGG CGTATCTCGC CGAAGAAGTG 
CACCCGGACG GGCTCGGACT CGCGATGGGG CTCTATGTCG GCGGCACCGC GATCGGCGGG 
ATGGCGGGGC GCGTGATCAC CGGCATTCTC ACCGACCTGT TCTCGTGGCG CATCGCGGTG 
GGCGCGATCG GCGTGCTCGG CCTCGCGTCG ATGCTCGCGT TCCGCATGCT GCTGCCGCCG 
TCGCGCCATT TCGTGCCGCG CCGCGGCCTG AACCTCGCGC ATCACCGCAC GTCGCTCGCC 
CATCATCTCC GCGGCCAGCG CGAGCTGCCC GTGCTGTTCG CGATGGCGTT CGTGCTGATG 
GGCAGCTTCG TCACGCTCTA CAACTACATC GGCTATCGGC TGCTCGCGCC GCCGTATTCG 
ATGGGGCAGG CGACGATCGG CGCGATCTTC GTCGTCTATC TGGTGGGCGT CGTCGCATCC 
CCGCTGTCGG GACGGCTCGC CGATACGCTC GGCCGCGGCC GCGTGCTGAT CGCGAGCCTC 
GCGGTGATGC TCGGGGGCGT CGCGCTGACG CTGCTGCATC CGGTTGCCGC GATCGTCGCG 
GGCGTCGCAT GCGTGACGTT CGGCTTCTTC GCGGGCCACG CGGTCGCGAG CGGCTGGGTC 
GGCCGGCTCG CGCAGCACGG CAAAGGCCAG GCGGCCGCGC TCTATCTACT CGCTTACTAT 
CTTGGCTCGA GCGTCGTCGG CTCGCTCGGC GGACGCTTCT GGAGCACGCT CGGCTGGCCG 
GGCGTCGCGG CGCTCGTCGG CGCGCTGCTC GCGCTCGGCG TGGTCGCGGC CGCCTGGCTG 
CGCGCGCGCG AGCGCGGCGG CGCCGCGTGA

Protein sequence

MTVPPGAPRP AAAGRANSAH AAQGASPVGA APYLERGSRG YWHASVALLF AGYATFSLLY 
YVQPLLPEFS KAFGVSPAQS SLALSFATAA LAAAVFVAGF VSEALSRHRL MTASLTASSL 
LTLAAAFAPH WHQLLILRAL TGLALGGVPA VAMAYLAEEV HPDGLGLAMG LYVGGTAIGG 
MAGRVITGIL TDLFSWRIAV GAIGVLGLAS MLAFRMLLPP SRHFVPRRGL NLAHHRTSLA 
HHLRGQRELP VLFAMAFVLM GSFVTLYNYI GYRLLAPPYS MGQATIGAIF VVYLVGVVAS 
PLSGRLADTL GRGRVLIASL AVMLGGVALT LLHPVAAIVA GVACVTFGFF AGHAVASGWV 
GRLAQHGKGQ AAALYLLAYY LGSSVVGSLG GRFWSTLGWP GVAALVGALL ALGVVAAAWL 
RARERGGAA