Gene BURPS1106A_A2864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2864
Symbol
ID	4905068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2805898
End bp	2807139
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	66%
IMG OID	640145967
Product	major facilitator family transporter
Protein accession	YP_001076893
Protein GI	126455534
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAT CCACCATGCC GGCCGGCGGC GTCGCGATCC GGCTTGGTCT CAAGGAAAAC 
TGGCGCCAGT TCGCACTACT CGTGCTGATC AATGCGTTCG TGGGTGGCAT GGTGGGGATC 
GAGCGGACGG TCGTGCCGCT GATCGGCTCC GAGACGTTTC ACATCCAGTC CACGACGCTC 
ATTACATCGT TCATCGTCAG CTTCGGGCTG GTGAAAGCCG TGGCGAACCT GATTTCCGGT 
CAACTGGCGG ACACCTGGGG CCGCAAGCGC GTGCTTGTGG CCGGCTGGCT GCTCGGGTTG 
CCGGTGCCGT TCATGATCAT CGCCGCGCCG AACTGGGAAT GGGTGATCGC GGCCAATGTG 
TTGCTGGGCC TCAGCCAGGG TTTTGCGTGG TCGATGACCG TGATCATGAA AGTGGATCTC 
GTGGGGCCGA AGGCGCGCGG GCTCGCGGTC GGGCTCAACG AGTTCGCGGG CTATTTCGCG 
GTGGGCCTGA CCGCGTTTCT GACCGGCTAC CTGGCGAGCC GCCACGGCCT GCGGCCGGCG 
CCGATCTATC TCGGCGTCGC GTATGCGATC GCCGGCCTGA CCCTGTCGAT TCTCGTCGTG 
CGCGATACGC GCGATCACGT TTGCCTGGAG GCCGGCAAGC CGAAAGAAGC AACGTCGCTG 
TCGTTCCACG ACGTGTTCCT GCTCGCGTCG CTGAAGGACC GCAACCTGTT CGCGGCGTCG 
CAGGCCGGGC TAATCAACAA CCTGAACGAC GGGATGAGTT GGGGCATCTT CCCGCTGTTT 
TTCACGGGAC TCGGGCTCGG CGTCGAACGG ATCGGCATCC TCAAGGCCGC CTATCCGATC 
GTGTGGGGCG TGTTTCAGGT CGTCACCGGC CCGTTGAGCG ACCGCTGGGG CCGCAAGGGG 
CTGATCGTCG CCGGGATGTG GGTTCAGGCG GCCGGCCTGG TGCTGACCGC GTCGATGGGC 
GAGTTCCGGT GGTGGCTGGT TGCCAGCGTG CTGCTCGGCC TCGGCACCGC GATGGTCTAC 
CCGAGCCTGA TCGCGGCCGT CTCCGATGCG TCGGATCCGC GCTGGCGTGC CCGGGCGCTG 
AGCGTGTACC GGTTCTGGCG TGACCTCGGC TATGCGATCG GCGCGCTGTC GGCGGGTCTC 
ATCGCGGACC GCTTCGGCTT CGCCGATGCG ATCCTGTCGA TCGCGGCCGT CACGTTCCTG 
TCAGGCGCCG TGGTGGCGAT CGTCATGCAC GCGCGCCACT GA

Protein sequence

MSKSTMPAGG VAIRLGLKEN WRQFALLVLI NAFVGGMVGI ERTVVPLIGS ETFHIQSTTL 
ITSFIVSFGL VKAVANLISG QLADTWGRKR VLVAGWLLGL PVPFMIIAAP NWEWVIAANV 
LLGLSQGFAW SMTVIMKVDL VGPKARGLAV GLNEFAGYFA VGLTAFLTGY LASRHGLRPA 
PIYLGVAYAI AGLTLSILVV RDTRDHVCLE AGKPKEATSL SFHDVFLLAS LKDRNLFAAS 
QAGLINNLND GMSWGIFPLF FTGLGLGVER IGILKAAYPI VWGVFQVVTG PLSDRWGRKG 
LIVAGMWVQA AGLVLTASMG EFRWWLVASV LLGLGTAMVY PSLIAAVSDA SDPRWRARAL 
SVYRFWRDLG YAIGALSAGL IADRFGFADA ILSIAAVTFL SGAVVAIVMH ARH