Gene BURPS1106A_A1367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1367
Symbol
ID	4904220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1287842
End bp	1289089
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	72%
IMG OID	640144473
Product	major facilitator family transporter
Protein accession	YP_001075402
Protein GI	126457040
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGCC TTCCCATTGC ATTTCGGCGC CTCGCGCTGT CGAATCTCGC CGCGCAGTCG 
GCCGAGCAGA TCGGCCTTGC GGTGGCGCCG CTCGTCGCCG TGCTGTCGCT CGGCGCGAGC 
GCAAGCGGCA CCGGCCTGTT GCAGACGGCG CAGACGTTGC CGTTTCTGCT GCTTTCGATT 
CCGCTCGGCG TCTGGGCGGA TCGGCATTCG CGCAAACGGA TCATGGCGGC CGCGGAGGGC 
CTGCGCGCGC TCGCGCTTGC CGCCACGCTC GCGCTGCTCG CCGCGCATGC GCTGACGCTG 
CCGTCGCTCG CGATGCTCGG TTTCGTCGGC GCGTGCGGGA CCGTCGCGTA CAGCGTGGCC 
GCGCCGGCGC TGATTCCCGC GCTCGTCGGC CGCGCGGCGC TCGCGCGGGC GAACGGCGCG 
ATCGAGCTCG CGCGCAGCGC CGCGTACTCG GCCGGCCCCG CGATCGGCGC GGCGCTCGTC 
GACCGGATCG GCGCGCAATG GGCCTACGGC TTCGCGGCGG CGCTGTCCGC CCATGCGGTG 
CTGCTGATCG TCCGCTTGCC GGACGTGCGC GCGCCGGCCG CGCCGCGCAA GCGCTTCGTC 
GCCGAATTGC TCGACGGCGC GCGCTTCGTC CGTCGCGATC GTCACCTGCG GCTGATGATC 
GTCACCGCGG TCTTCTTCAA TGTCGGCTTC TTCACGTTGC AGGCCGTATA CGTGCCGTAT 
GCGGTTCGGC ATCTGGCGCT GGGCGCGTCG CAGATCGGCA TGACGTTCGC CGCGTACGGC 
ATCGGCATGA CGGGCGGCGC GGCGCTCGCG TCGGCGATCG CGCGGCGCGT CAGGTTCGGC 
GTCGTGCTCA CGATCGGGCC CGTGGGCGGT CTCGTCGCGT CGCTCGTCAT GGCCGTGTCG 
ATCTTCGCGC CGTCGTTCTG GCTCGCCGCG TCGAGTTTCT TCCTGCTCGG CGCGGGCCCG 
ATCTTGTGGA GCGTCGCGTC GACGACGCTG CGCCAGGCGA TCACGCCGCC GGCGATGCTC 
GGCCGCGTGT GCGCGATCAA CGGCACCGCG ACCTACGGCG CGCGTCCGCT CGGCGCGCTC 
GTGGGCGCTG TCGTCGCGGC GCGGTTCGGG ATCGATGCGT GCATCTGGGC ATCGGTTGGC 
GGCTTCGTGA TCCAGGCGGC CGTGATCGTG CGATCCGCGG TATCGAGGCT CGAGCGGATT 
CCGGACGTAT CGGATGCGGC GCCGCGCTAC GCGCCGCTGC CCGATTGA

Protein sequence

MNRLPIAFRR LALSNLAAQS AEQIGLAVAP LVAVLSLGAS ASGTGLLQTA QTLPFLLLSI 
PLGVWADRHS RKRIMAAAEG LRALALAATL ALLAAHALTL PSLAMLGFVG ACGTVAYSVA 
APALIPALVG RAALARANGA IELARSAAYS AGPAIGAALV DRIGAQWAYG FAAALSAHAV 
LLIVRLPDVR APAAPRKRFV AELLDGARFV RRDRHLRLMI VTAVFFNVGF FTLQAVYVPY 
AVRHLALGAS QIGMTFAAYG IGMTGGAALA SAIARRVRFG VVLTIGPVGG LVASLVMAVS 
IFAPSFWLAA SSFFLLGAGP ILWSVASTTL RQAITPPAML GRVCAINGTA TYGARPLGAL 
VGAVVAARFG IDACIWASVG GFVIQAAVIV RSAVSRLERI PDVSDAAPRY APLPD