Gene BURPS668_A1591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1591
Symbol
ID	4887142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1525627
End bp	1527030
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	73%
IMG OID	640131530
Product	major facilitator transporter
Protein accession	YP_001062587
Protein GI	126445559
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCCA TCACCGCCCC TTCGTGGGCA GAGCTGCTGT CCGGCCGCAA CGGCTTGCGC 
TCGATCGCGC TCGCAGGCGG GGTCGCGCTG CATGCGATCA ACATCTACAT CGCGACGACC 
ATCCTGCCTT CGGTCGTGCG CGACATCGGC GGGCTCGAAT ATTACGCATG GAACACCACG 
CTGTTCATGG CCGCCTCGAT CGTCGGCGCG CCGCTGTCCG CGAATGTCCT GAGCCGGTTC 
GGGCCGCGCG CCGCGTATCT CGTCGCGCTC GTCGTGTTCT GCGCGGGCAC GCTCGCGTGC 
GCGGGCGCGA AGGACATGCC GTGGATGCTC GTCGGCCGGG CCGCGCAAGG CTTCGGCGGC 
GGCATCCTGT TCGCGCTCAG CTACGCGCTG ATCCGCATCG TGTTCGACGA GCGGCTGTGG 
TCGCGCGCGA TGGCGATGGT CTCCGGCATG TGGGGCGTCG CGACGCTGTG CGGGCCCGCG 
ATCGGCGGCG TGTTCGCGCA ATCGGGCACG TGGCGGCTCG CGTTCGTCGC GCTCGTGCCC 
GTCGCCGCGG TGCTCGCGCT GATCGTGATC GTTCAGTTGC CCGCGCGCGA AGCATCGGGG 
GCGCGGGCCG CGCGGCCCGC GATCGGCAAG ATCCTGCTGC TCGCGGTGTC GGTACTCGTC 
GTGTCGGTCG CGAGCCTGTC CAAGGCGATC GTCGCGAACG TCACGGGCGT CGCCGCGGGC 
CTCGCGGTCG CGCTGCTGAT CGCGCGCCTC GAGCGCGGCG CGACGCGCCG GCTGCTGCCG 
ACGGGCGCCT ACGACGTGCG CGCGCCGCTC GGCGCGATCT ACGCGTGCAT GAGCCTGCTC 
GTGATCGGCA TGACGACCGA GATCTTCGTG CCGTACTTCC TGCAGATCAT CCACGGCTAC 
CCGCCGCTTC TCGCCGGCTA CCTGACCGCG CTGATGGCGG CCGGCTGGAC CGCCGGCTCG 
CTGTTCAGCT CGGGGCGCAG CGGCGCGGCC GCGCAGGCGC TCGTGCGCGG CGGGCCGCTC 
GTCGTTGTGA TCGCGCTCGT CGCGCTCGCG CTCGTCGTGC CGCCGCAGCA CCTGCTCGCG 
GGCGGCGCCG GCCTCGCCGC GCTGTGCGCG GCGCTCGCGG CGGTGGGCGT CGGCATCGGC 
GTGGGCTGGC CGCATCTGCT CACGCAGGTG CTGACGAACG CGCCGGCGGG CCAGGAAGAT 
CTCGCGTCGA CGTCGATCAC GACCGTCCAG CTCTATGCGA CCGCGATCGG CTCCGCGCTC 
GCGGGCCTTG TCGCGAACCT CGCCGGCTTC TCCGCGCCCG GCGGCCTCGC CGGCGCGCAG 
CATGCGGCCG CGTGGCTGTT CGCGGTGTTC GCGGCGGCGC CCGTGCTCGC CGCGATCGTC 
GCGCGCCGCG TGCGCGCGCG ATGA

Protein sequence

MSSITAPSWA ELLSGRNGLR SIALAGGVAL HAINIYIATT ILPSVVRDIG GLEYYAWNTT 
LFMAASIVGA PLSANVLSRF GPRAAYLVAL VVFCAGTLAC AGAKDMPWML VGRAAQGFGG 
GILFALSYAL IRIVFDERLW SRAMAMVSGM WGVATLCGPA IGGVFAQSGT WRLAFVALVP 
VAAVLALIVI VQLPAREASG ARAARPAIGK ILLLAVSVLV VSVASLSKAI VANVTGVAAG 
LAVALLIARL ERGATRRLLP TGAYDVRAPL GAIYACMSLL VIGMTTEIFV PYFLQIIHGY 
PPLLAGYLTA LMAAGWTAGS LFSSGRSGAA AQALVRGGPL VVVIALVALA LVVPPQHLLA 
GGAGLAALCA ALAAVGVGIG VGWPHLLTQV LTNAPAGQED LASTSITTVQ LYATAIGSAL 
AGLVANLAGF SAPGGLAGAQ HAAAWLFAVF AAAPVLAAIV ARRVRAR