Gene BURPS1106A_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2044
Symbol
ID	4900437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2027478
End bp	2028800
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	69%
IMG OID	640135274
Product	MFS transporter, metabolite:H+ symporter (MHS) family protein
Protein accession	YP_001066309
Protein GI	126453686
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGCAAT CCGCAGTTCC CCTCGACACG GGCACGGCCG TGTCGCCCCC TACGTCGAGC 
GCCGGGCGAG CAATCGCCGC GGCGTCGATC GGCAACGCGC TCGAGTGGTA CGACTTTTCC 
GTCTATGCAT TCTTCGCCGT CTACATCGCG CGGAACTTCT TCCATCGAGG CAACACCGGC 
ACCGAGCTGG TCGAGGCTTT CATGGCGTTC GGCATCGGCT TCATCGCACG GCCGCTCGGC 
GCGCTCGCGA TCGGCGTATA CGGCGACCGC GCGGGCCGCA AGGCCGCGCT CACGCTGACC 
ATCCTCGTGA TGGCAACCGG CACGGGCGTC ATCGCGTTCG CGCCGCCATA CGCCGCGATC 
GGCGTGGGCG CGCCGCTGCT GATCCTCTGC GGGAGGCTAC TGCAGGGCTT CTCGGCGGGC 
GGCGAAGTGG GCGGCGCGGC GGCGTTTCTC ATCGAGCACG CGCCGGCGGA CCGCAAGGGC 
TGCTACGCGT CGTGTCTGCA GGCGAGCATG GCCGCGTCGA ACATCCTCGG CGCGCTGGTC 
GCGACCGGCG TGACGCTTAC GCTGACGCGC GAACAGATCG GCGATTGGGG ATGGCGGATT 
CCGTTCATCC TCGGCCTCGC GATCGCGCCG GTCGGCCTCT GGCTGCGCAG GACGCTCGAC 
GAGACGCCGC ACTTCCGCGC CGAGATGGCG CGCGCGCAGC ACGCGCATGC GGAACAGAAA 
GCGCCGCTTC TGCAGGTGGT GCGCGACCAC CCGCGCGCGC TCGCCGTCGG CACGGGATTC 
TCGGTGCTCT GGGCCGTGTG CGTCTACGCG CTGGTGATCT ATATGCCGAC GCACGCGCAG 
CGCGCACTGC ATTTCGACGG GCGCGACGCG TTCATCGCGT CGCTGGTCGG CAACTGCCTG 
ATGGCCGTCA CCTGCGTGTG CGCGGGAAGC TGGTCCGACC GCCTCGGCCG GCGCACGGTG 
CTCGCCGCCG GCGCGGCGCT GATGCTCGTG TCGGTCTATC CGCTGCTGCG CTGGCTGAGC 
GACGTGCACA CGCTCGCCGC GCTCCTTACC GTCCAGAGCG CGTTCTGCGT GTTGGTGGCC 
ATCTTCACGG GAGTGGCGCC CGCAGCGCTG TCGGAGCTGT TCCCGACCCG CGTACGTGCG 
ACCGGCATGT CCCTGTCCTA CAACATCGCC ACGACGATCT TCGGCGGCTT CGCGCCCGCG 
ATCCTCGCAT GGCTCACGCA ACAGACCGGC AATCCGTTTG CGCCGGCCTG GTACGTGATG 
GTGGCGAGCG CCATCGCGCT CGCATCGATC GCCGCGCTTT CTTCCACGCC ACGCCACGCC 
TGA

Protein sequence

MKQSAVPLDT GTAVSPPTSS AGRAIAAASI GNALEWYDFS VYAFFAVYIA RNFFHRGNTG 
TELVEAFMAF GIGFIARPLG ALAIGVYGDR AGRKAALTLT ILVMATGTGV IAFAPPYAAI 
GVGAPLLILC GRLLQGFSAG GEVGGAAAFL IEHAPADRKG CYASCLQASM AASNILGALV 
ATGVTLTLTR EQIGDWGWRI PFILGLAIAP VGLWLRRTLD ETPHFRAEMA RAQHAHAEQK 
APLLQVVRDH PRALAVGTGF SVLWAVCVYA LVIYMPTHAQ RALHFDGRDA FIASLVGNCL 
MAVTCVCAGS WSDRLGRRTV LAAGAALMLV SVYPLLRWLS DVHTLAALLT VQSAFCVLVA 
IFTGVAPAAL SELFPTRVRA TGMSLSYNIA TTIFGGFAPA ILAWLTQQTG NPFAPAWYVM 
VASAIALASI AALSSTPRHA