Gene BURPS1106A_3465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3465
Symbol
ID	4900311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3372159
End bp	3373358
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	640136691
Product	major facilitator family transporter
Protein accession	YP_001067702
Protein GI	126454500
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCCG TCACCGCTCC CTCCCCCGCG CTGACGCGCG GGATGACGCT GCTGTTCGCG 
TGCGCCTGCG GCATCGTCAT CGGCAACCTC TATTATTCGC AACCGCTTCT CGCGGCGATC 
GCGGCGAGCT TCGGGCGCCA ACCCGCCGAG CTCGGCTATC TCGTCACGCT GACGCAGCTC 
GGCTACGCGG CGAGCCTCCT CGTCGTCGTG CCGCTCGGCG ACGTCGTCAA TCGCCATACG 
CTGATCGTGC GGCTGCTTGT CGCCAATGTC GTCGCGCTCG TCGCGGTGGC GTCGAGCACG 
CGCTACGGCT TTTTCGTCGC GGCGAACATG TGCGTCGGCT TCGTCACGTG CTCGACGCAA 
CTGCTCGTGC CGTTCGCCGC GTCGCTCGCC GACGACGGGG CGCGCGGCCG CGCGATCGGC 
ACCGTGATGA GCGGCCTGTT GCTCGGCATC CTGCTCGCAC GCGTCGCATC GGGCGCGATC 
GCCGACTGGC TCGGCTGGCG CGCCGTCTAT GCGATCGCGG CGGCGATGGT GCTGTTGCTC 
GCGGGCGTGC TCGCCGCGAA GCTGCCGAAG GACCGCCGCC ATGCACGCGT CGACTACGCG 
GCGCTGATGC AATCGCTCGC CGCGCTCGTG CGCGCGCAGC CGCTGATCGC GCTGCGCTGC 
GCATACGGCG CGCTCGTGTT CGCGTGCTTC AGCCTGCTGT GGACGGGCCT CACGTTTTTG 
CTCAGCCAGC CGCCATACGG CTACACGGAA GGCCGGATCG GCCTGTTCGG AATCGTCGGC 
GCGGTGGGCG CGCTCGCCGC GGCGTCGGCG GGGCGGCTCG TCGACCGCGG TCACGGCAAC 
GCGGCCACCG GCCTGTTCGC GGCGGCGGTG CTCGCGTCGT TCGCGGCGAT CGCGGCGGGC 
GAGCAATCGC TCGCCGCGCT GATCGTCGGC ATCCTCGTGC TCGACATCGG CGTGCAGGGC 
CTGCACATCT CGAACCAGAG CGTGATCTAT GCGCTCGCCG GCGACGCGCG CAGCCGCGTC 
ACGACGATCT ACCTGACGAG CTATTTCATC GGCGGCGCGC TCGGCTCGGG CGCGGCGGGC 
GCCGCGTTCG GCATCGACGG CTGGCGCGGC GTCTGCATCG CGGGCGCGAT CCTGTCGGGC 
TCGCTCGTCG CGCTGTGGGG CGCGTCGCAG CGCGTCGGCG CGCGGCAGGC CGCGCGGTAG

Protein sequence

MNSVTAPSPA LTRGMTLLFA CACGIVIGNL YYSQPLLAAI AASFGRQPAE LGYLVTLTQL 
GYAASLLVVV PLGDVVNRHT LIVRLLVANV VALVAVASST RYGFFVAANM CVGFVTCSTQ 
LLVPFAASLA DDGARGRAIG TVMSGLLLGI LLARVASGAI ADWLGWRAVY AIAAAMVLLL 
AGVLAAKLPK DRRHARVDYA ALMQSLAALV RAQPLIALRC AYGALVFACF SLLWTGLTFL 
LSQPPYGYTE GRIGLFGIVG AVGALAAASA GRLVDRGHGN AATGLFAAAV LASFAAIAAG 
EQSLAALIVG ILVLDIGVQG LHISNQSVIY ALAGDARSRV TTIYLTSYFI GGALGSGAAG 
AAFGIDGWRG VCIAGAILSG SLVALWGASQ RVGARQAAR