Gene BURPS1106A_A2244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2244
Symbol
ID	4905434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2228281
End bp	2229474
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	71%
IMG OID	640145349
Product	major facilitator transporter
Protein accession	YP_001076277
Protein GI	126456336
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCGTCG TCTTCACCGC ATTGACGAAT CTCGCCGATG GCGTGACGAA GGTCGCGCTG 
CCGCTGATGG CGACCGCACT CACGCACTCG CCCGCGCGCA TCTCGGGCGT ATCACTGACA 
CTGACGCTGC CCTGGCTGCT CGTCGCGCTT CACGTCGGCG TGCTGGTGGA CCGCTTCGAT 
CGCCGCACGC TGCTGTGGCT CGCGAACGCG GCGCGCATGG CCGCCATGGC GCTGCTCATC 
GCGCTGCTGC CATCCGGCCG CGTCACGCTG CCGGTGCTGT ACGCGAGCGG CCTGACGCTC 
GGCCTCGCCG AGGTCGTCGC GCTGACTTCC GCGGCCGCCT TGATTCCGGA CGCCGTCGCC 
CCTTCGAGCC GCGAGCGCGC GAACGCATGG ATCGCCGGCA CGGAAACCGT CTGCAACGAA 
TTCTGCGGCC CGCTCACCGG CGGCATGCTG GTCGCGGCCG GCACGGCGAT CGCGCTCGGC 
GCCGTTGCCG TCGGCTACTT CGGCGGCGGC GTCGCGCTGT TTTTCCTGAT CGGGCGGTTC 
CGCGTCGCGC ATGCGCCGCA TGGGCGGCCG CCGCCCGTTC GCCTGCAGAT TGCCGAAGGG 
CTCGGATGCC TGTGGCACCA GCCGTTGCTC CGGCTGATGG CCGTCGCGCT GACGGTGCTC 
TGCATGTGCT GGGGCGCATG GCTCGCGCTG ATGCCGCTGT TCGCGACGAC GGTGCTCGGC 
CTCGACTCGC GCGGCTATGG CGTGACGGTC AGCGCGCTCG GCGTCGGCGG CTTCGTCGGC 
GCGCTGAGCG TCACCTTGCT GAACCGCCGC TTCGGGCGGC GCACCGTCAT GCTCACGGAT 
CTGCTCGGCA CCTTCGCGAT GATGGCCGTA CCGGTGCTGA GCACGAACCT ATGGGCCGTC 
GCGGCGAGCG CATTCGCGGG CGGCCTGGGC GGCACGCTGT GGACGGTCAA TGCGAGGACG 
ATCAGCCAGC ATCTCGTGCC GGGGCCGCTG CTCGGCCGCT ACAATGCGGC GGCCCGCCTG 
TTCAGTTGGG GAGCGATGCC GATCGGCGCG GGCCTTGCCG GCGCGATCGC GGAACTGCTG 
GGCATGCGCG CCGCGTTCGC GGCGCTCGCC GTCGCGGCCT TGCTGTTGAT CGTGCCGTTC 
CTGCGCGTCG CTTCGGCGCA AGCGCTGCGA ATCGGCCCCG AACGCCGACA TTGA

Protein sequence

MLVVFTALTN LADGVTKVAL PLMATALTHS PARISGVSLT LTLPWLLVAL HVGVLVDRFD 
RRTLLWLANA ARMAAMALLI ALLPSGRVTL PVLYASGLTL GLAEVVALTS AAALIPDAVA 
PSSRERANAW IAGTETVCNE FCGPLTGGML VAAGTAIALG AVAVGYFGGG VALFFLIGRF 
RVAHAPHGRP PPVRLQIAEG LGCLWHQPLL RLMAVALTVL CMCWGAWLAL MPLFATTVLG 
LDSRGYGVTV SALGVGGFVG ALSVTLLNRR FGRRTVMLTD LLGTFAMMAV PVLSTNLWAV 
AASAFAGGLG GTLWTVNART ISQHLVPGPL LGRYNAAARL FSWGAMPIGA GLAGAIAELL 
GMRAAFAALA VAALLLIVPF LRVASAQALR IGPERRH