Gene BURPS1106A_A0591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0591
Symbol
ID	4903441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	580731
End bp	581933
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	70%
IMG OID	640143697
Product	major facilitator family transporter
Protein accession	YP_001074627
Protein GI	126457001
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCA ACCTTGCCTC TTCCGCCACG GCCGGCCCCG TCCCGCAAAT GGCGCGCGGC 
CTGATCCTGC TGTTCGCGTT CAGTTGCGGC GCGATCGTCG CCAATCTCTA CTACGCGCAG 
CCGATCATCG CGCTGATCGC GCCGGACCTG CACATGTCCG GCGGCATGGC GAGCCTCATC 
GTGTCGCTCA CGCAGATCGG CTACGCGGCC GGCCTGTTCT TTCTCGTGCC GCTCGGCGAT 
CTGGTCGAGA ACAAGAAGCT GATGGTCGTC ACCGCGCTGA CGTCGATCGC GAGCCTCGCG 
CTCGCCGCGA CCGTGCGCGC GCCGGGCCTG TTCCTCGCCG TCTCGCTGAT CGTCGGCTTC 
AGCTCGGTCG CGGTGCAACT GCTGATTCCG CTCGCCGCGC ACCTCGCGCC GAGCGAATCG 
CGCGGGCGCG TCGTCGGCAC GATCATGAGC GGCCTGCTGC TCGGCATCCT GCTGTCGCGC 
CCCGTCGCGA GCTTCATCGC CGATCACTTC GGCTGGCGCG CGGTGTTCGC GTTCGGCGCG 
GCCACGATGG CGGTCGTCAC CGTGCTGCTG ATGCTGACGG TCCCGAGCCG CCGGCCCGCG 
CATCAGGCGA CGTACATGCA ACTGATCCGC TCGCTCGGGC GGCTCGTCGC GACGCAGCCG 
GCGCTGCGCG AGCGCTCGCT CTACCAGGGG CTGATGTTCG GTTCGTTCAG CCTGTTCTGG 
AGCGCGGCGC CGGTCGAGCT GATGCATCGC CATCATCTGT CGCAATCGGC GATCGCGCTG 
TTCTCGCTCG TCGGCGCGAT GGGCGCGAGC TCCGCGCCGA TCGCCGGGCG CCTCGCCGAC 
GCCGGCCACA CCGGGCGCGC GACCGTCGTC GCGCTCGGGC TCGCCGCGGC GAGCTTCGCG 
CCGGCGCTGT TCGTGCCGGG TGCCGGCGTC GCCGGGCTCG TCGCGACCGG CATCCTGCTC 
GACTTCGCGG TGCAGATGAA CATGGTGCTC GGCCAGCGGG AGATCTACGC GCTCGACGCG 
CACAGCCGCA ATCGCCTGAA CTCGATCTAC ATGACGAGCA TCTTCGTCGG CGGCGCGATC 
GGCTCCGCGC TCGCGAGCGC GCTCTACGAG CACGGCGGCT GGACATGGAT CGCGATCGTC 
GGCGCGCTCT TTCCGCTCGC GGCGCTCGCG CGCTTCGCCT TTGCGTCGCG CGCCGCCCGA 
TGA

Protein sequence

MNANLASSAT AGPVPQMARG LILLFAFSCG AIVANLYYAQ PIIALIAPDL HMSGGMASLI 
VSLTQIGYAA GLFFLVPLGD LVENKKLMVV TALTSIASLA LAATVRAPGL FLAVSLIVGF 
SSVAVQLLIP LAAHLAPSES RGRVVGTIMS GLLLGILLSR PVASFIADHF GWRAVFAFGA 
ATMAVVTVLL MLTVPSRRPA HQATYMQLIR SLGRLVATQP ALRERSLYQG LMFGSFSLFW 
SAAPVELMHR HHLSQSAIAL FSLVGAMGAS SAPIAGRLAD AGHTGRATVV ALGLAAASFA 
PALFVPGAGV AGLVATGILL DFAVQMNMVL GQREIYALDA HSRNRLNSIY MTSIFVGGAI 
GSALASALYE HGGWTWIAIV GALFPLAALA RFAFASRAAR