Gene BURPS668_A1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1238
Symbol
ID	4886391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1173269
End bp	1174477
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	73%
IMG OID	640131177
Product	major facilitator superfamily protein
Protein accession	YP_001062235
Protein GI	126443303
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCAC GTTCCGCTTC CTCGCCCCGT CCGCCGATTC CGCGCACCGT ATGGGCGCTC 
GGCTTCGTCA GCCTGTGCAT GGATGTGTCG TCGGAGCTGA TCCACGCGCT GCTGCCGATC 
TATCTCGTGA CGACGATGGG CATGAGCGTC GCGGCGCTCG GCGTGCTCGA AGGCGCGGCC 
GAGGCGACCG CGATGATCGT CAAGATCTTC TCCGGCGCGC TCAGCGATTG GCTGGGCCGG 
CGCAAGGCGC TGCTGCTGCT CGGCTACGGG CTCGCCGCGC TGACGAAGCC GCTCTTTCCG 
CTCGCGGCAG GGCCGGCGAC GGTCGCCGCC GCGCGGCTGC TCGATCGCGT CGGCAAGGGC 
ATTCGCGGCG CGCCGCGCGA TGCGCTCGTC GCCGATGTCG CGCCGCCCGA GATCCGCGGC 
GCGTGCTTCG GGCTGCGCCA GTCGATGGAC ACCGTTGGCG CGTTCGCGGG GCCGCTGCTC 
GCGATCGCGC TGATGCTCGC GTTCGCCGAT CACATCCGCG CGGTGCTGTG GTTCGCGGTC 
GTGCCGGCGT TCGCCGCGGT CGCGCTGATC CTGTTCGGCG TCGAAGAGCC CGCGTCCGCG 
CCCGCCGCCG CGCGGGCGTT CCGCTCGCCG CTGCACTGGC GCGCGCTGCG CGCGTTTTCC 
GGTCGCTACT GGTTCGTCGT GCTGATCGGC ACCGCGTTCA CGCTCGCGCG CTTCAGCGAG 
GCGTTCCTCG TGTTGCGCGC GCAGCAGGTG GGGCTCGACA TCGCATGGAT CCCGGCCGTG 
ATGGTCGTGA TGAGCGTAGC GTACGCGGCG TCCGCGTATC CGGTCGGCAT CGTGTCCGAC 
AAGTTCGGCG CGCGCGCGCC GCTCGCGGCC GGCATGCTGC TGCTGATCGC GGCCGATCTG 
CTGCTGGGCG CGAGCGCGTC GCGCACGGCG CTGTTCGCGG GCGTCGCCGT TTGGGGGCTG 
CACATGGGTT TCACGCAGGG CATGCTCGCC GCGCTCGTCG CGCAAACCGC GCCGGCCGCG 
CTGCGCGGCA CCGCGTTCGG CGTGTTCAAT CTCGCGGGCG GGATCGCGAT GCTCGCGGCG 
AGCGCGCTCG CCGGCTGGCT GTGGGAACAC CACGGCGCGC CGACGACGTT CTTCACCGGC 
GCGGCGCTCG CGGCCGTCGC ACTCGCGATG TGCGGATTCG TTCGGCGGCG CCCGGGGTCT 
GCGGCATGA

Protein sequence

MPARSASSPR PPIPRTVWAL GFVSLCMDVS SELIHALLPI YLVTTMGMSV AALGVLEGAA 
EATAMIVKIF SGALSDWLGR RKALLLLGYG LAALTKPLFP LAAGPATVAA ARLLDRVGKG 
IRGAPRDALV ADVAPPEIRG ACFGLRQSMD TVGAFAGPLL AIALMLAFAD HIRAVLWFAV 
VPAFAAVALI LFGVEEPASA PAAARAFRSP LHWRALRAFS GRYWFVVLIG TAFTLARFSE 
AFLVLRAQQV GLDIAWIPAV MVVMSVAYAA SAYPVGIVSD KFGARAPLAA GMLLLIAADL 
LLGASASRTA LFAGVAVWGL HMGFTQGMLA ALVAQTAPAA LRGTAFGVFN LAGGIAMLAA 
SALAGWLWEH HGAPTTFFTG AALAAVALAM CGFVRRRPGS AA