Gene BURPS1106A_2442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2442
Symbol
ID	4900973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2398824
End bp	2400044
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID	640135670
Product	major facilitator family transporter
Protein accession	YP_001066702
Protein GI	126454280
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.508707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAA CCGCGCTGCC GCGCGGCACG GTTGCGCTGT TCGCCGGTGC GAGCGGCTTG 
AGCGTGGCGA ACGTCTACTA TGCGCAGCCG CTTCTCGACG CGCTTGCCGC GGATTTCACG 
ATCGGCCGCG CGGCGATCGG CGGCGTCGTG ACCGCCACGC AAATCGGCTG CGCACTTGCG 
CTGCTGTTGC TCGTGCCGCT CGGCGACCTC GTCGACCGCC GCCGGCTGAT GCTCGTGCAA 
TCGCTCGCGC TCGCGGCAAC GTTGATCGCC GTCGGCTTCG CGTCGGCCAG CGCCGTGCTG 
ATCGCCGGCA TGCTTGGCAC AGGGCTGCTC GGCACGGCGA TGACCCAGGG GCTCGTATCG 
TACGCGGCGA GCGCCTCGGC CTCGCACGAG CGCGGGCGCG TGGTCGGCGC CGCGCAAGGC 
GGCGTCGTGA TCGGGCTGTT GCTCGCGCGC GTGCTGGCGG GCTTCGTCGG CGACGTGGCG 
GGATGGCGCG GCGTCTATTT CCTGTCGGCG GCGACGATGC TCGCGCTCGC GGCGCTGCTC 
GCGCGCAAGC TGCCCGCCCT CGCGCCGGCA TCGCCGCGCA TCGGCTATCC GCGACTGATC 
GCATCGCTGT TCGGCCTGCT GCGCGACGAG CGCGTCTTGC AGATCCGCGG GATGCTCGCG 
ATGCTGATGT TCGCCGCGTT CAACATTTTC TGGAGTGCGC TCGCGCTGCC GCTCAGCGCG 
CCGCCCTATA CGCTTTCGCA CACCGCGATC GGCGCATTCG GGCTCGTCGG CGCATTGGGC 
GCGTTCGCCG CCGCGCGCGC CGGGCATTGG GCCGATCGCG GCTTCGGACA ACCGACGAGC 
GCCGCGGCGC TCGCGCTGCT GCTCGCATCG TGGCTGCCGC TCGCCTTCAT GCCGATGTCG 
CTATGGGCGC TCGTGCTCGG CATCGTGCTG CTCGATGCCG GCGGACAGGC GATTCACGTG 
ACGAATCAGA GCATGATCTT CCGCGCGCGG CCGGATGCGC ACAGCCGGCT CATCGCCGCC 
TACATGCTGT TCTATTCGGT CGGCAGCGGG CTCGGCGCGA TCGCGTCGAC GGCCGTCTAC 
GCAACGCACG GATGGCGCGG CGTCTGCATG CTGGGCGCGG CCGTCAGCGC GGCGGCGCTC 
ATATTCTGGG CGGCCACGGC GCGGCCGACG CCGAACGAAG CCGCGTCGGC GCATACGGCA 
AACGGGCGGC TCCGGCGGTG A

Protein sequence

MTQTALPRGT VALFAGASGL SVANVYYAQP LLDALAADFT IGRAAIGGVV TATQIGCALA 
LLLLVPLGDL VDRRRLMLVQ SLALAATLIA VGFASASAVL IAGMLGTGLL GTAMTQGLVS 
YAASASASHE RGRVVGAAQG GVVIGLLLAR VLAGFVGDVA GWRGVYFLSA ATMLALAALL 
ARKLPALAPA SPRIGYPRLI ASLFGLLRDE RVLQIRGMLA MLMFAAFNIF WSALALPLSA 
PPYTLSHTAI GAFGLVGALG AFAAARAGHW ADRGFGQPTS AAALALLLAS WLPLAFMPMS 
LWALVLGIVL LDAGGQAIHV TNQSMIFRAR PDAHSRLIAA YMLFYSVGSG LGAIASTAVY 
ATHGWRGVCM LGAAVSAAAL IFWAATARPT PNEAASAHTA NGRLRR