Gene BURPS668_0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0023
Symbol
ID	4882216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	23389
End bp	24951
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	67%
IMG OID	640125951
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001057078
Protein GI	126439577
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCGA CGGCCCCCGC TTCCCCTTCC CGCTCCGCCG AGCCGGCGCC GCTGTCGGGC 
GGCACGCTCG CGCTGCTGAC GATCGGGCTC GCGCTCGGCA CGTTCATGGA GGTGCTCGAC 
ACGTCGATCG CGAACGTCGC GGTGCCGACG ATCTCCGGCA GCCTCGGCGT CGCGACGAGC 
GAAGGCACGT GGGTGATCTC GTCGTATTCG GTCGCCTCCG CGATCGCGGT GCCGCTGACC 
GGCTGGCTCG CGCGGCGGGT CGGCGAGGTG CGGCTGTTCA CGCTGTCGGT GCTCGCGTTC 
ACGATCGCGT CCGCGCTCTG CGGCCTCGCG GAGAACTTCG AGACGCTGAT CGCGTTCCGG 
CTGTTGCAGG GGCTCGTGTC GGGGCCGATG GTGCCGCTGT CGCAGACGAT CCTGATGCGC 
AGCTATCCGC CCGCGAGGCG CGGGCTCGCG CTCGGCCTAT GGGCGATGAC GGTGATCGTC 
GCGCCGATCT TCGGCCCGCT GCTCGGCGGC TGGATCAGCG ACAACTACAC GTGGCCGTGG 
ATCTTCTACA TCAACCTGCC GATCGGCGTG TTCTCCGCCG CGTGCGCGTT CTTCCTGTTG 
CGCGGCCGCG AGACGAAGAC GACGAAGCAG CGGATCGACG CGATCGGGCT CGCGCTGCTC 
GTGATCGGCG TGTCGTGCCT GCAGATGATG CTCGACCTCG GCAAGGACCG CGACTGGTTC 
AACTCGACGT TCATCACCTC GCTCGCGCTG ATCGCCGTCG TGTCGCTCGC GTTCATGCTC 
GTGTGGGAAT CCACCGAGAA GGAGCCGGTC GTCGACCTGT CGCTCTTCAA GGACCGCAAC 
TTCGCGCTCG GCGCGATGAT CATCTCGTTC GGCTTCATGG CGTTCTTCGG CTCGGTCGTG 
ATCTTTCCGC TGTGGCTGCA GACCGTGATG GGCTACACGG CGGGCCTCGC CGGCCTCGCC 
ACCGCGCCCG TCGGCATCCT CGCGCTCGTG CTCTCGCCGA TGATCGGCCG CAACATGCAC 
CGGCTCGATC TGCGGATGGT CGCGAGCTTC GCGTTCGTCG TGTTCGCCGT CGTGTCGATC 
TGGAATTCGA TGTTTACGCT CGACGTGCCG TTCAACCATG TGATCCTGCC GCGGCTCGTG 
CAGGGCATCG GCGTCGCGTG CTTTTTCGTG CCGATGACGA CGATCACGCT CTCCAGCATT 
CCCGACGAGC GGCTCGCGAG CGCGTCGGGG CTGTCGAACT TCCTGCGTAC GCTGTCGGGC 
GCGATCGGCA CCGCGGTGAG CTCGACGTTC TGGGAAAACG ACGCGATCTA TCACCACGCG 
CGGCTCGCCG AATCGGTGAA CGTGTATGCG CAGAGCACGC TCGACTATCA AGGCGCGCTC 
GCGCGGCTCG GCGTGATGGG CGACGTGTCG ACCGCGCAGA TCAACCAGAT CGTCACGCAG 
CAGGGCTTCA TGATGGCGAC CAACGACTTT TTCCACATTT CGGCGCTCGC GTTCGTCGCG 
CTCGCGGCGC TCGTGTGGGT GACGAAGCCG AAGAAAGGGG CCGGGCCCGC GATCGGGCAC 
TGA

Protein sequence

MAATAPASPS RSAEPAPLSG GTLALLTIGL ALGTFMEVLD TSIANVAVPT ISGSLGVATS 
EGTWVISSYS VASAIAVPLT GWLARRVGEV RLFTLSVLAF TIASALCGLA ENFETLIAFR 
LLQGLVSGPM VPLSQTILMR SYPPARRGLA LGLWAMTVIV APIFGPLLGG WISDNYTWPW 
IFYINLPIGV FSAACAFFLL RGRETKTTKQ RIDAIGLALL VIGVSCLQMM LDLGKDRDWF 
NSTFITSLAL IAVVSLAFML VWESTEKEPV VDLSLFKDRN FALGAMIISF GFMAFFGSVV 
IFPLWLQTVM GYTAGLAGLA TAPVGILALV LSPMIGRNMH RLDLRMVASF AFVVFAVVSI 
WNSMFTLDVP FNHVILPRLV QGIGVACFFV PMTTITLSSI PDERLASASG LSNFLRTLSG 
AIGTAVSSTF WENDAIYHHA RLAESVNVYA QSTLDYQGAL ARLGVMGDVS TAQINQIVTQ 
QGFMMATNDF FHISALAFVA LAALVWVTKP KKGAGPAIGH