Gene BURPS1106A_0885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0885
Symbol
ID	4900546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	868206
End bp	869417
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	76%
IMG OID	640134115
Product	major facilitator family transporter
Protein accession	YP_001065166
Protein GI	126453044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.106194
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATT GCACGACGCG GCCCGCCGGC TTCGCGCGGC CGTCGCGCGA AGCCGCGCGC 
CTGCCGCTCG CGGGATTGCT CGCGCTCGCG ACGGCCGGCT TCATCACGAT CGTGACCGAG 
GCGCTGCCCG CCGGGCTGCT GCCGCTGATG GGGCGCGACC TGCGCGTGTC CGATGCGCTC 
GTCGGCCAGC TCGTCACAGT CTATGCGGCG GGCTCGATCG TCGCGGCGAT GCCGCTCGTC 
GCGGCGACGC GCGGCATGCG CAGGCGGCCG CTGCTGCTCG CCGCGCTCGC GGGCTTCGTC 
GTCGCGAACA CGGCGACGGC CGCGTCGCCG TACTACGCGC CCGTGCTCGT CGCGCGCTGC 
GTCGCGGGCG TCTCGGCGGG GCTCCTGTGG GCGCTGCTCG CGGGCTACGC GAGCCGGATG 
GTCGACGCGC GGCAGCGCGG CCGCGCGATC GCGATCGCGA TGCTCGGCGC GCCGGTGGCG 
ATGTCGGTCG GCATTCCGCT CGGCACGGCG CTCGGCGCCG CGCTCGGCTG GCGCGCGACG 
TTCGCCGGCG TGACGGCGCT CACGCTCGCG CTGATCGCGT GGGTGCGCGC GAGCCTGCCC 
GATGCGCCGG GGCGGCCCTC GGGCGAGCGG CTGCCGGTCG CCCGCGTGCT GCGGATGCCG 
GGCGTGCTGC CCGTGCTGGC GGTGATGTTC GCGTACGTGC TCGCGCACAA CATCCTCTAC 
ACGTACATCG CGCCGTTTCT CGCGAGCGCC GGGATGGGCA CGCGCATCGA CGCGACGCTG 
TTCGCGTTCG GCGCGGCGTC GTTCGCGGGC ATCGGTCTCA CGGGCGTGTG GATCGGCAAC 
GGGCTGCGGC GGCTCGCGCT CGCGAGCATC GCGCTTTTCG CGCTCGCGTC CGTGCTGCTC 
GGCGTGGCGA GCGGATCGCC CGCGGTCGTC TATGCGAGCG TCGCCGTGTG GGGGCTCACG 
TTCGGCGGCG CGGCGACGGT CTTCCAGACC GCGTCGGCGA ACGCGGCGGG CGAGGCGGCG 
GACGTCGCGC AATCGATGAT CGTCACGGTG TGGAATCTCG CGATCGCGGC CGGCGGCGTC 
GCGGGCGGCG TGCTGCTCGA GCGGTTCGGC GCGGGCGCGA TGCCGTGGGC GCTCGTCGCG 
CTGCTCGTGC CCGCGTGGCT CGGCGCGTGG CGCGCGCGGC GCCACGGCTT CCCGGCGGCC 
CGCGCGCCGT GA

Protein sequence

MSDCTTRPAG FARPSREAAR LPLAGLLALA TAGFITIVTE ALPAGLLPLM GRDLRVSDAL 
VGQLVTVYAA GSIVAAMPLV AATRGMRRRP LLLAALAGFV VANTATAASP YYAPVLVARC 
VAGVSAGLLW ALLAGYASRM VDARQRGRAI AIAMLGAPVA MSVGIPLGTA LGAALGWRAT 
FAGVTALTLA LIAWVRASLP DAPGRPSGER LPVARVLRMP GVLPVLAVMF AYVLAHNILY 
TYIAPFLASA GMGTRIDATL FAFGAASFAG IGLTGVWIGN GLRRLALASI ALFALASVLL 
GVASGSPAVV YASVAVWGLT FGGAATVFQT ASANAAGEAA DVAQSMIVTV WNLAIAAGGV 
AGGVLLERFG AGAMPWALVA LLVPAWLGAW RARRHGFPAA RAP