Gene BURPS1106A_A1266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1266
Symbol
ID	4905624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1198385
End bp	1199692
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	64%
IMG OID	640144372
Product	major facilitator family transporter
Protein accession	YP_001075301
Protein GI	126458142
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACCGATC GATATCGACG ACACGCTGAC ATGATGAATA AAAAGCCCCT GAGCCTGACG 
CAAATCGTGC TCGCGACTTC GGTCGGCAAC GCGCTCGAAT GGTTCGATAT CGCCATTTAT 
GCGTTCTTCG CCGTGCATAT CGCGAAGAAT TTCTTCCCGA CCGCGAACGA GACGGCGTCG 
ATGCTGCTCA CGTTCGGCTC GTTCGGCGCG TCGTATCTCG TGCGGCCGAT CGGCGGCATG 
GTGCTGGGCG CCTACGCGGA CAAGCGCGGG CGCAAGGCGG CACTGATGAT GTCGGTCGGT 
CTGATGATGA TCGGCACGGC GATCATCGCG GTGATTCCGC CACATGCGTC GATCGGCCTG 
CTCGCGCCAG CAGGCGTGTT CATCGCACGG CTGATTCAGG GTTTTTCGGC GGGCGGCGAA 
TTCGGCGCTT CGACGGCGAT GCTGATCGAA CATGCACCCG AGCGTCGCGG CCTGCTCGCA 
AGCTGGCAGT TCGCGACGCA AGGCCTCGCG ACCCTGCTCG CGTCGACCTT CGGCTTCGCG 
CTCGCCAAGC TGATGCCCGC CAGCGAGCTC TCCGCATGGG GCTGGCGCAT GCCGTTCTTC 
TTCGGGCTGC TGATCGGGCC GGCGGGTCTG TATCTGCGAC GCTTTCTCGA AGATGCGGCC 
GATTACACCG AAGCCGAGCA CACGGCCACG CCGGTGCGCG ATGTACTCAC GCGGCAGAAG 
GCGTTGCTGC TGACCTCGAT CGGTGCGCTG ACGGTGTCGA CGGCGGTGAA CTACCTGTTG 
CAGTACGTGC CGACGTTCGC GATCCGCGAA TTGCATCTCG ATGCATCGAC GGGTTTCGCC 
GCGAGCATCG TCGCGGGGCT GATGCTGACC TTGGTCACGC CGTTCGCGGG GCATCTGTCC 
GACAAAATCG GCCGCGTGAA GCAGATGTCG ACTGCGGCGC TGCTACTGTT CGTGACGGGT 
TATCCGGCGT TCGCGTATGT CGTGTCGCAT GTGTCGGTAG CGGCGTTGTT CGGGCTCGTC 
GCGTGGCTTG CGCTGCTCAA GGCGGTGTAT TTCGGCGCGC TGCCGGCGCT CATGTCGGAG 
ATTTTCCCCA CATCGACGCG CGTGACGAGC ATTTCAATCA GCTACAACAT CGGCGTGACG 
GTGTTCGGCG GTTTTACGCC GGCGATCGTC ATCTGGCTGT CGAGCGCGAC GGGCAGCAAG 
GCGGCACCGA GCTTCTACAT GATGTTCACG GCCGTGATCA GTCTCGCGGC GCTGGCGGCA 
GTGAGCCGCG GGAAAGAGCC GCTGAGCTCG GCGGGCACGG CGGCCTGA

Protein sequence

MTDRYRRHAD MMNKKPLSLT QIVLATSVGN ALEWFDIAIY AFFAVHIAKN FFPTANETAS 
MLLTFGSFGA SYLVRPIGGM VLGAYADKRG RKAALMMSVG LMMIGTAIIA VIPPHASIGL 
LAPAGVFIAR LIQGFSAGGE FGASTAMLIE HAPERRGLLA SWQFATQGLA TLLASTFGFA 
LAKLMPASEL SAWGWRMPFF FGLLIGPAGL YLRRFLEDAA DYTEAEHTAT PVRDVLTRQK 
ALLLTSIGAL TVSTAVNYLL QYVPTFAIRE LHLDASTGFA ASIVAGLMLT LVTPFAGHLS 
DKIGRVKQMS TAALLLFVTG YPAFAYVVSH VSVAALFGLV AWLALLKAVY FGALPALMSE 
IFPTSTRVTS ISISYNIGVT VFGGFTPAIV IWLSSATGSK AAPSFYMMFT AVISLAALAA 
VSRGKEPLSS AGTAA