Gene BURPS1710b_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1044
Symbol
ID	3689616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	1091480
End bp	1092691
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	76%
IMG OID	637727500
Product	major facilitator family transporter
Protein accession	YP_332456
Protein GI	76808583
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATT GCACGACGCG GCCCGCCGGC TTCGCGCGGC CGTCGCGCGA AGCCGCGCGC 
CTGCCGCTCG CGGGATTGCT CGCGCTCGCG ACGGCCGGCT TCATCACGAT CGTGACCGAG 
GCGCTGCCCG CCGGGCTGCT GCCGCTGATG GGGCGCGACC TGCGCGTGTC CGATGCGCTC 
GTCGGCCAGC TCGTCACAGT CTATGCGGCG GGCTCGATCG TCGCGGCGAT GCCGCTCGTC 
GCGGCGACGC GCGGCATGCG CAGGCGGCCG CTGCTGCTCG CCGCGCTCGC GGGCTTCGTC 
GTCGCGAACA CGGCGACGGC CGCGTCGCCG TACTACGCGC CCGTGCTCGT CGCGCGCTGC 
GTCGCGGGCG TCTCGGCGGG GCTCCTGTGG GCGCTGCTCG CGGGCTACGC GAGCCGGATG 
GTCGACGCGC GGCAGCGCGG CCGCGCGATC GCGATCGCGA TGCTCGGCGC GCCGGTGGCG 
ATGTCGGTCG GCATTCCGCT CGGCACGGCG CTCGGCGCCG CGCTCGGCTG GCGCGCGACG 
TTCGCCGGCG TGACGGCGCT CACGCTCGCG CTGATCGCGT GGGTGCGCGC GAGCCTGCCC 
GATGCGCCGG GGCGGCCCTC GGGCGAGCGG CTGCCGGTCG CCCGCGTGCT GCGGATGCCG 
GGCGTGCTGC CCGTGCTGGC GGTGATGTTC GCGTACGTGC TCGCGCACAA CATCCTCTAC 
ACGTACATCG CGCCGTTTCT CGCGAGCGCC GGGATGGGCG CGCGCATCGA CGCGACGCTG 
TTCGCGTTCG GCGCGGCGTC GTTCGCGGGC ATCGGTCTCA CGGGCGTGTG GATCGGCAAC 
GGGCTGCGGC GGCTCGCGCT CGCGAGCATC GCGCTTTTCG CGCTTGCGTC CGTGCTGCTC 
GGCGTGGCGA GCGGATCGCC CGCGGTCGTC TATGCGAGCG TCGCCGTGTG GGGGCTCACG 
TTCGGCGGCG CGGCGACGGT CTTCCAGACC GCGTCGGCGA ACGCGGCGGG CGAGGCGGCG 
GACGTCGCGC AATCGATGAT CGTCACGGTG TGGAATCTCG CGATCGCGGC CGGCGGCGTC 
GCGGGCGGCG TGCTGCTCGA GCGGTTCGGC GCGGGCGCGA TGCCGTGGGC GCTCGTCGCG 
CTGCTCGTGC CCGCGTGGCT CGGCGCGTGG CGCGCGCGGC GCCACGGCTT CCCGGCGGCC 
CGCGCGCCGT GA

Protein sequence

MSDCTTRPAG FARPSREAAR LPLAGLLALA TAGFITIVTE ALPAGLLPLM GRDLRVSDAL 
VGQLVTVYAA GSIVAAMPLV AATRGMRRRP LLLAALAGFV VANTATAASP YYAPVLVARC 
VAGVSAGLLW ALLAGYASRM VDARQRGRAI AIAMLGAPVA MSVGIPLGTA LGAALGWRAT 
FAGVTALTLA LIAWVRASLP DAPGRPSGER LPVARVLRMP GVLPVLAVMF AYVLAHNILY 
TYIAPFLASA GMGARIDATL FAFGAASFAG IGLTGVWIGN GLRRLALASI ALFALASVLL 
GVASGSPAVV YASVAVWGLT FGGAATVFQT ASANAAGEAA DVAQSMIVTV WNLAIAAGGV 
AGGVLLERFG AGAMPWALVA LLVPAWLGAW RARRHGFPAA RAP