Gene BURPS1106A_A2507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2507
Symbol
ID	4905291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2469163
End bp	2470368
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	74%
IMG OID	640145611
Product	major facilitator transporter
Protein accession	YP_001076538
Protein GI	126457528
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCCGC TCCGATCGAT TCTCCCGTTG GCCCTGTTCA CCGCCGTCGG GCTGCTCGCC 
ACCGACCTCT ATCTCCCCGC CGTGCCGTCG TTGCCGCAGC AGCTCGGCGG CTCCATCGAA 
AGCGCGCAGG CGACGCTCGC CGCGTTCTCG GCCGCGCTCG CCGTGTCGCA GCTCGTCTGG 
GGCGCGGCCG CCGACCGCTT CGGGCACCGC CGCACGCTCG CGTTCGCGGT GCTGCTGCAA 
CTCGTCGCGG GCGCCGCGTG CGCGCTCGCG CCTTCGATGG GCGCGCTGAT CGGCGCGCGC 
CTCGCGCAGG GCTTCGGCGT CGGCGCGGCG ATGGTCATCG TCCCCGCGCT CGTGCGACAG 
TCGTTCGGCG ACGGCGGCGC GGTCCGCGCG CTCGCATGGC TCGGCATCGT CGAAAGCGCG 
GTGCCCGGAC TCGCGCCCCT CGTCGGCGCG GCGCTGCTCG TCGTGGCCGA CTGGCGAACG 
AGCTTCTGGA TCATCGTCGC GTTGTCCGCC ATCGCGGCGC CGCTCGTGTT CCGCGTGATT 
CCGACGGCTC GCGCGATGCG CGCGTGTGCG CCGGCGAACG TCGGCGCACA CGCGGGCGGC 
TATCGGCGGC TGCTGCGCTC GCCCGTCTAT CTCGGCTACG CGCTCGGCCA CGCGCTCTGC 
TTCGCCGCGC TGCTCGCGTT CGTCGCGAGC GCGCCGCAAG TCGTCGAGAT CTGGCTCGGC 
GCGGGGCCGT CGACGTTCAG CCTGATGCAG GCGTGCGGGG TCGCCGCGTT CATGCTGAGC 
GCCGCGCGCA GCGGCAAATG GTCCGACGCG CTCGGCCTCG ACCGGATCAT CGCGCTCGGC 
GCGCTGCTGC AGTTCGCGGC GTCGGCCGCG TTCCTGCTGC TCGCGTATGC CGATTGGCGC 
TCGACGCCGC TCGTCGTCGC ATCGTGGATG CTGTTCTGCG GCTCGCTCGG CCTGCGCGGG 
CCGGCGTCGA TGGCGCGCGC GCTCGCGGCC GAGCCCGCCG TCGCGGGACG CGCGGCCGGG 
CTGCTGATGT TCTTCGGGCT CGGCGGCGCG GCGCTCGCGA CACAGGCCGT CGCGCCGTTC 
CTGCGGCTGG GGCTCGCGCC CGTCGCGTGG ATGTGCGCGG GCTTCACGCT CGCGAGCGGC 
GCGGTCGTGC TGTGGGGCAT CGCGATACGC GGCCGACATC GCGCGGCGGC CACGGAAATC 
GCGTGA

Protein sequence

MHPLRSILPL ALFTAVGLLA TDLYLPAVPS LPQQLGGSIE SAQATLAAFS AALAVSQLVW 
GAAADRFGHR RTLAFAVLLQ LVAGAACALA PSMGALIGAR LAQGFGVGAA MVIVPALVRQ 
SFGDGGAVRA LAWLGIVESA VPGLAPLVGA ALLVVADWRT SFWIIVALSA IAAPLVFRVI 
PTARAMRACA PANVGAHAGG YRRLLRSPVY LGYALGHALC FAALLAFVAS APQVVEIWLG 
AGPSTFSLMQ ACGVAAFMLS AARSGKWSDA LGLDRIIALG ALLQFAASAA FLLLAYADWR 
STPLVVASWM LFCGSLGLRG PASMARALAA EPAVAGRAAG LLMFFGLGGA ALATQAVAPF 
LRLGLAPVAW MCAGFTLASG AVVLWGIAIR GRHRAAATEI A