Gene BTH_II2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II2072
Symbol
ID	3845128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	+
Start bp	2525888
End bp	2527288
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	69%
IMG OID	637839373
Product	major facilitator family transporter
Protein accession	YP_440260
Protein GI	83716115
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.264718
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCCGTG CGCCATCCCG CGCGTTGCAC CGTCAGTCCG ACGACGAGGC CCGCCGCCCG 
GCCCCATCCG CGCGGTACAC AACCATTCGA ACCAGGATCG CCCCGACCAT GCCTGCTTCC 
GAACTGAGCG CCGTCTCAAG CGCCCCGCCC CGCGCCCTGA CGGGCCGCGA CTACAAAACC 
CTCGGCCTCG CCGCGTTGGG CGGCGCGCTG GAGTTCTACG ATTTCATCAT CTTTGTGTTC 
TTCGCGCCCG CGATCGGCCA GCTGTTCTTC CCGCACGACA TCCCCGACTG GCTTCGCCAG 
TTGCAGACGT TCGGCATCTT CGCGGCCGGC TATCTCGCGC GGCCGCTCGG CGGCATCGTG 
ATGGCGCACT TCGGCGACCT CGTCGGCCGC AAGCGGATGT TCACGCTGAG CGTGCTGCTG 
ATGTCGGTGC CGACGCTGCT GATGGGCCTG CTGCCCACCT ACGACAGCGT CGGCATCCTC 
GCGCCGGTCG CGCTGCTGCT GTTCCGCGTG CTGCAGGGCG CGGCGGTGGG CGGCGAAGTG 
CCCGGCGCGT GGGTGTTCGT GTCCGAGCAC GTGCCGTCGC AGCGCATCGG CTACGCGTGC 
GGCACGCTGA CGGCGGGCCT CACGATCGGC ATCCTGCTCG GCTCGCTCGT CGCGACGGCC 
ATCAACAGCC GCTTCTCGAC AGCCGAAGTC GCCGCGTTCG CGTGGCGCAT CCCGTTCCTG 
CTCGGCGGCG TGTTCGGCCT CTTCTCCGTC TACCTGCGCC GCTGGCTGCA CGAGACGCCC 
GTGTTCGCCG AGATGAAGGC GCGCAAGACG CTCGCGGCCG AGATCCCGCT GAAGGCGGTG 
ATTCGCGACC ACGGCCGCGC GGTGATCGTG TCGATGCTGA TCACGTGGAT GCTGTCGGCG 
GCGATCGTCG TCGTGATCCT GATGACGCCG ACGCTGCTGC AAAAGCAGTT TCATATCGCA 
CCCGCGACCG CGCTGTTCGC GAACAGCATC GCGACGCTGT GCCTGACGGC CGGCTGCATC 
ACCGCCGGCT CGCTCGCGGA CCGCTTCGGC GCGAAGGCGG TGCTGTCGAT CGGCGGCATC 
GCGCTCGCCG CGTGCTACTA CGCGATGTAC ACGCAGATCG CCGTCGACGC CTCGCGCCTC 
GTGCCGCTCT ACGGGCTCGC GGGCTTCGCC GTCGGCACGA TCGGCGCGGT GCCGTTCGTG 
CTGGTGAAGA GCTTTCCGGC CGTCGTGCGC TTCTCGGGCA TCTCGTTCTC TTACAACGTC 
GCGTACGCGG TGTTCGGCGG GCTCACGCCG GTGATCGTGT CGCTGCTGAT GAAATCGAGC 
CCGCTCGCGC CGGCCTACTA TGTCGCGGCG ATCTGCGTGC TCGGCGCGGT CGCGATGCCG 
TTCGCGAAGG ACGCCGAATA A

Protein sequence

MSRAPSRALH RQSDDEARRP APSARYTTIR TRIAPTMPAS ELSAVSSAPP RALTGRDYKT 
LGLAALGGAL EFYDFIIFVF FAPAIGQLFF PHDIPDWLRQ LQTFGIFAAG YLARPLGGIV 
MAHFGDLVGR KRMFTLSVLL MSVPTLLMGL LPTYDSVGIL APVALLLFRV LQGAAVGGEV 
PGAWVFVSEH VPSQRIGYAC GTLTAGLTIG ILLGSLVATA INSRFSTAEV AAFAWRIPFL 
LGGVFGLFSV YLRRWLHETP VFAEMKARKT LAAEIPLKAV IRDHGRAVIV SMLITWMLSA 
AIVVVILMTP TLLQKQFHIA PATALFANSI ATLCLTAGCI TAGSLADRFG AKAVLSIGGI 
ALAACYYAMY TQIAVDASRL VPLYGLAGFA VGTIGAVPFV LVKSFPAVVR FSGISFSYNV 
AYAVFGGLTP VIVSLLMKSS PLAPAYYVAA ICVLGAVAMP FAKDAE