Gene BURPS1106A_0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0023
Symbol
ID	4902041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	23442
End bp	25004
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	67%
IMG OID	640133253
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001064308
Protein GI	126455044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.636069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCGA CGGCCCCCGC TTCCCCTTCC CGCTCCGCCG AGCCGGCGCC GCTGTCGGGC 
GGCACGCTCG CGCTGCTGAC GATCGGGCTC GCGCTCGGCA CGTTCATGGA GGTGCTCGAC 
ACGTCGATCG CGAATGTCGC GGTGCCGACG ATCTCCGGCA GCCTCGGCGT CGCGACGAGC 
GAAGGCACGT GGGTGATCTC GTCGTATTCG GTCGCCTCCG CGATCGCGGT GCCGCTGACC 
GGCTGGCTCG CGCGGCGGGT CGGCGAGGTG CGGCTGTTCA CGCTGTCGGT GCTCGCGTTC 
ACGATCGCGT CCGCGCTCTG CGGCCTCGCG GAGAACTTCG AGACGCTGAT CGCGTTCCGG 
CTGTTGCAGG GGCTCGTGTC GGGGCCGATG GTGCCGCTGT CGCAGACGAT CCTGATGCGC 
AGCTATCCGC CCGCGAAGCG CGGGCTCGCG CTCGGCCTGT GGGCGATGAC GGTGATCGTC 
GCGCCGATCT TCGGCCCGCT GCTCGGCGGC TGGATCAGCG ACAACTACAC GTGGCCGTGG 
ATCTTCTATA TCAACCTGCC GATCGGCGTG TTCTCCGCCG CGTGCGCGTT CTTCCTGTTG 
CGCGGCCGCG AGACGAAGAC GACGAAGCAG CGGATCGACG CGATCGGGCT CGCGCTGCTC 
GTGATCGGCG TGTCGTGCCT GCAGATGATG CTCGACCTCG GCAAGGATCG CGACTGGTTC 
AACTCGACGT TCATCACCTC GCTCGCGCTG ATCGCCGTCG TGTCGCTCGC GTTCATGCTC 
GTGTGGGAAT CCACCGAGAA GGAGCCGGTC GTCGACCTGT CGCTCTTCAA GGACCGCAAC 
TTCGCGCTCG GCGCGATGAT CATCTCGTTC GGCTTCATGG CGTTCTTCGG CTCGGTCGTG 
ATCTTTCCGC TGTGGCTGCA GACCGTGATG GGCTACACGG CGGGCCTCGC CGGCCTCGCC 
ACGGCGCCCG TCGGCATCCT CGCGCTCGTG CTCTCGCCGA TGATCGGCCG CAACATGCAC 
CGGCTCGATC TGCGGATGGT CGCGAGCTTC GCGTTCGTCG TGTTCGCCGT CGTGTCGATC 
TGGAATTCGA TGTTTACGCT CGACGTGCCG TTCAACCATG TGATCCTGCC GCGGCTCGTG 
CAGGGCATCG GCGTCGCGTG CTTTTTCGTG CCGATGACGA CGATCACGCT CTCCAGCATT 
CCCGACGAGC GGCTCGCGAG CGCGTCGGGG CTGTCGAACT TCCTGCGTAC GCTGTCGGGC 
GCGATCGGCA CCGCGGTGAG CTCGACGTTC TGGGAAAACG ACGCGATCTA TCACCACGCG 
CGGCTCGCCG AATCGGTGAA CGTGTATGCG CAGAGCACGC TCGACTATCA AGGCGCGCTC 
GCGCGGCTCG GCGTGATGGG CGACGTGTCG ACCGCGCAGA TCAACCAGAT CGTCACGCAG 
CAGGGCTTCA TGATGGCGAC CAACGACTTC TTCCACATTT CGGCGCTCGC GTTCGTCGCG 
CTCGCGGCGC TCGTGTGGGT GACGAAGCCG AAGAAAGGGG CCGGGCCCGC GATCGGGCAC 
TGA

Protein sequence

MAATAPASPS RSAEPAPLSG GTLALLTIGL ALGTFMEVLD TSIANVAVPT ISGSLGVATS 
EGTWVISSYS VASAIAVPLT GWLARRVGEV RLFTLSVLAF TIASALCGLA ENFETLIAFR 
LLQGLVSGPM VPLSQTILMR SYPPAKRGLA LGLWAMTVIV APIFGPLLGG WISDNYTWPW 
IFYINLPIGV FSAACAFFLL RGRETKTTKQ RIDAIGLALL VIGVSCLQMM LDLGKDRDWF 
NSTFITSLAL IAVVSLAFML VWESTEKEPV VDLSLFKDRN FALGAMIISF GFMAFFGSVV 
IFPLWLQTVM GYTAGLAGLA TAPVGILALV LSPMIGRNMH RLDLRMVASF AFVVFAVVSI 
WNSMFTLDVP FNHVILPRLV QGIGVACFFV PMTTITLSSI PDERLASASG LSNFLRTLSG 
AIGTAVSSTF WENDAIYHHA RLAESVNVYA QSTLDYQGAL ARLGVMGDVS TAQINQIVTQ 
QGFMMATNDF FHISALAFVA LAALVWVTKP KKGAGPAIGH