Gene BURPS1106A_A0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0204
Symbol
ID	4904669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	192045
End bp	193358
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	71%
IMG OID	640143311
Product	major facilitator family transporter
Protein accession	YP_001074247
Protein GI	126455895
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.289201
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACGT CCGCTCTCAA TTTCGCCGGC GCGCCGGCCG ACGCGCGCGC CGCCGCGAAG 
AAACGCCGCC TAATCGCCGC GGCCGCCGTC GGCAACGCGC TCGAGTTCTA CGATTTCACC 
GTCTACAGCT TCTTCGCGAT CCTGATCGGC AAGCTGTTCT TCCCGGTTCA CTCGCCGTTC 
GGGCAGCTGA TGCTCGCGGT CGCGAGCTTC GGCGTGGGGT TCGTCACGCG CCCGCTCGGC 
GGGCTCGTGA TCGGCGTCTA CGCGGATCGC GCCGGGCGCA AGCGCGCGAT GATCGCAACG 
CTGCTCATCA TGGCGCTCGG CACCGCGACG ATCGCCGTCG CGCCGACTTA CGCGCAGATC 
GGCATCGCGG CGCCGCTGCT GCTCGTGGCC GCGCGCTTGC TGCAGGGGTT CGCGTCCGGC 
GGCGAGGTCG GCGCGTCCAC CACGCTGCTG ATCGAGCAGG CGCCGCAGGC GCGGCGCGGC 
TTCTATGCGT CGTTCCAGTT CTCGAGCCAG GGGCTCGCCG CGCTCGCCGG CGCGCTCACC 
GGCGTGCTGC TCACGTCGAC GCTCAGCGCC GCGCAGCTCG AGAGCTGGGG GTGGCGCGTG 
CCGTTCGTCA TCGGCACGCT GTTCGCGCCG CTCGGCTACT GGCTGCGGTG CACGGTCGAC 
GAGGCGCCGG CGGCCGCGCC CGCGCCGCGC GGCGACGCCG CGCCGCTGCC GCTCGCCGAC 
GTGCTGCGCC ATCACGGCAA GGCCGTGTTC GCCGGCCTCG GCATCACGAT CGGCGGCACG 
TCGATCCACT ACATCATCGT GTTCTACATG GCGATCTACG GCGTGCAGGT GCTGCATCTG 
CCGAGCTGGC TGTCGATGTC GGCGGGCTGC ATCGCCGGCG CGATCCTCGC GGTGGTCACG 
CCGATCGGCG GCCATCTGTC GGACCGCTAC GGGCGCAACC GGATCGTCTG GTGGACGCGC 
GTCGCGCTGA TGCTCGCGAT CTATCCGGCG TTCGTCGCGC TCAACCGCTG GCCCGGCGCG 
GCTTCGCTGC TGTCGATCAT CGCGGCACTC GCGAGCGTGC ATGCGATCAA CATCGGCGCG 
ACGGGCGCGA TGCTCGGCGA GCTGTTCCCG CGCGCGGTGC GCGCGACGGG CGGCGCGCTC 
GTCTACAGCG TCGGCGTCGC GATCTTCGGC GGATTCGCGC AATTCTTCGT CACGTGGCTG 
ATCGCCGCGA CGGGCAATGC GAACGCGCCC GCGTGGTACG CGATCGGCTG CGGCGCGCTG 
ACGCTCGCCG CGCTCGGCTC GATGGACGAC AAGGCGGGCA AGCCGCTCGA CTGA

Protein sequence

METSALNFAG APADARAAAK KRRLIAAAAV GNALEFYDFT VYSFFAILIG KLFFPVHSPF 
GQLMLAVASF GVGFVTRPLG GLVIGVYADR AGRKRAMIAT LLIMALGTAT IAVAPTYAQI 
GIAAPLLLVA ARLLQGFASG GEVGASTTLL IEQAPQARRG FYASFQFSSQ GLAALAGALT 
GVLLTSTLSA AQLESWGWRV PFVIGTLFAP LGYWLRCTVD EAPAAAPAPR GDAAPLPLAD 
VLRHHGKAVF AGLGITIGGT SIHYIIVFYM AIYGVQVLHL PSWLSMSAGC IAGAILAVVT 
PIGGHLSDRY GRNRIVWWTR VALMLAIYPA FVALNRWPGA ASLLSIIAAL ASVHAINIGA 
TGAMLGELFP RAVRATGGAL VYSVGVAIFG GFAQFFVTWL IAATGNANAP AWYAIGCGAL 
TLAALGSMDD KAGKPLD