Gene BURPS668_2333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2333
Symbol
ID	4881757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	2312184
End bp	2313377
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	73%
IMG OID	640128261
Product	major facilitator superfamily permease
Protein accession	YP_001059366
Protein GI	126442111
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATCA AGACATTGCG GCAAGAACCC GCGCTGGCGG GCGCGGCATC GCCCGCCGAT 
ACGCCCGCTT TCACGAGCGG CACGCTGGCC GCGCTCGTCG CGTTCGCGGC GATCACGCCG 
CTGCTGCTGC TCGTCGCGCC GGCCGTGGCC GGCCAATTGG GCGCGCAGCT CGGGCTGTCG 
GCGTCGCGGA TCGGCACGTA CTTCTTCGTG GAGCTGGGCG CGTTCAGCGC CGCGACGCTG 
CCGTCGTACC TGTGGCTCGG CCGCATCGAC GCGCGGCGCA TCGCGTGGGG CGCGACCGCC 
GTGTTCTGCG CGGGCAATCT CGCAACCGCC GTATGGATGC CGGGCTTCGC GCCGCTACTC 
GCGCTGCGCG CGGCAACGGC GCTCGGCGGC GGCACGTTGA TGGTGCTCTG CATGACGAGC 
GCCGCGGCGA GCGGCAACAG CGATCGCGTC TACGGGCTCT GGGTCGTCGG CCAGTTGATC 
GCGGGCGCGG CCGGTCTGTT CCTGCTGCCG CATCTGTTCG ATATGGTCGG ACTGCGCGCA 
CTGTACGCCG TGCTCGCCGC GCTCGCGCTG TGCGCCGCGC CGCTCGCGCG CCGCTTTCCG 
GCCGTGCCGC GCGGGCGGGC GCAGCACGCG CCGCGCGGGC GGGCGCAAGC GGCGCGCATG 
GCGGCGGCGC TTGCGATCGG CGGCGTGCTG ACGTTCTACG TCGCGATCGG CGGCGTGTGG 
ACCTTCGCGA GCAAAGCGGC GTCCGCCGTC GGCCTCGACG CGCAGACGAG CGGCAACGTG 
CTCGCGATCG CGAGCCTGAT GGGCATCGCG GGCGCGGCGC TCGCGTCATA TCTGGGCGGC 
CGTGCGGCGC GGCGCGCGAT GCTGCTCGCC GGATACGGCA TCCTCGCGGC GTCGCTCGTC 
GCGCTTGCCG CCGCGCCAAA CGCGAACGGC TACACGCTCG CGATCTTCGG TTTCAAGTTC 
GCATGGACGT TCGTCCTGCC GTTCATGCTC GCGAGCGTCG CGGCCGTCGA CGCGACGGGG 
CGCCTGATCG CGACGCTCAA TCTCGTGATC GGTTCGGGGC TCGCCGCCGG GCCGCTCGCC 
GCCGGACTGA TGCTCGACGG CGGCGGCACG CTGCGCGCGC TGTTCTCGAT CGCGGCCGCG 
GTCTCGCTCG TCTCGCTCGC GGCCATGCTG CGCGTCGAGC GCGACGCGCG CTGA

Protein sequence

MTIKTLRQEP ALAGAASPAD TPAFTSGTLA ALVAFAAITP LLLLVAPAVA GQLGAQLGLS 
ASRIGTYFFV ELGAFSAATL PSYLWLGRID ARRIAWGATA VFCAGNLATA VWMPGFAPLL 
ALRAATALGG GTLMVLCMTS AAASGNSDRV YGLWVVGQLI AGAAGLFLLP HLFDMVGLRA 
LYAVLAALAL CAAPLARRFP AVPRGRAQHA PRGRAQAARM AAALAIGGVL TFYVAIGGVW 
TFASKAASAV GLDAQTSGNV LAIASLMGIA GAALASYLGG RAARRAMLLA GYGILAASLV 
ALAAAPNANG YTLAIFGFKF AWTFVLPFML ASVAAVDATG RLIATLNLVI GSGLAAGPLA 
AGLMLDGGGT LRALFSIAAA VSLVSLAAML RVERDAR