Gene BURPS668_2524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2524
Symbol
ID	4882389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2495107
End bp	2496408
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	72%
IMG OID	640128452
Product	major facilitator family transporter
Protein accession	YP_001059551
Protein GI	126439132
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACA GCATGCAGGA CAGCCTCGAC GAAGCCGCGC GGCCCGCGCG CGTCTCGTGG 
CTCGCGGCGC TGCGCGGCCC GTTCGCTTAC CGCACGTTCG CGGCGATCTG GGTCGCGAGC 
CTCGTCGGCA ATATCGGCGG ATCGATTCAG ACCGTCGCCG CGTCGTGGCT GATGACGTCG 
ATGGCGCCGT CGCCGACGAT GGTCTCGCTC GTGCAGACGG CGTTCACCTT GCCGATCGCG 
CTGTTCGCGC TGCTGTCGGG CGTCGCCGCC GACGCGTGGG ATCGCCGCAC GGTGATGCTG 
CTGTCGCAGG CGCTGATGTT CTCGGTTGCG CTGTGTCTCG TCGCGCTCGC CGCCGCGGGC 
GCGATGACGC CGGCGCGCCT GCTCGTCTGC ATGTTCGTCG GCGGCTGCGC GGGCGCGATG 
TTCCAGCCCG CGTGGCAGTC CGCCGTGACC GAGCAGGTGC CCGCGCGCGA GCTGTCCGCG 
GCGATCGCGC TCGACAGCTT CTCGATGAAC TTCGCGCGCA CCGCCGGGCC CGCGCTGGGC 
GGCTTCATCG TCGCTTCCGT GTCGCCGAAC GCGGCGTTCG TTCTCAGCGG GCTGTCGTAC 
GCGGGGCTCA TCTACGTGCT GTCGCGCTCG ATTCGCGGCG CGGCGGCGCG CCCGCCCGTG 
CGCGAGCGCC TCGCGACGAT GCTCGTTCAA GGCGTTCGCT ATTGCGGCCG TGCGCGCGGC 
ATTCGCGGCA CGTTGATCCG CAGCAGCCTG TTCGGGTTTC TCGGCAGTCC CGTCTGGGCG 
CTGCTGCCGC TCTTCGCGAA AACGCAATTC GGCGGCGAGG CGCGCACCTA CGGCGTGCTG 
CTCGCGTCGT TCGGCGCGGG CGCGGCGTCC GGCGCGCTGG GCGGCGCGGC GGGGCGCGCG 
CGACTCGGCC GCGAGGCGCT CGTGCGGCTG TGCACGCTCA CGTTCGCCGC CGGCATGCTG 
GCGACCGCGT GGAGCCCATG CCAGGCCGTC GCGATGCTGG GCCTCGCCGT CGCGGGCGGT 
AGCTGGGTCG TGGTCGTCTC GACTTACAAC CTGACGATCC AGACGGCATC GCCGGCCTGG 
GTGGCCGGGC GCTCGCTGTC GCTGTTTCAT TCGTTCATCG TCGGCGGGCT GTCGATCGGC 
AGCTATCTCT GGGGCGTCGC CGCGCAGGGC AGCTCGATCA ACTCGGCGTT CGCGGTATCG 
GCGCTGATGA TGGCGGCGTC GGCGTGTCTC GCGGCATGGC TGCCGCTGCC CACGCACGAG 
GCGCTCGGCG AGCGGACGCA CGGCGAGCCG CGGCGGACAT GA

Protein sequence

MTDSMQDSLD EAARPARVSW LAALRGPFAY RTFAAIWVAS LVGNIGGSIQ TVAASWLMTS 
MAPSPTMVSL VQTAFTLPIA LFALLSGVAA DAWDRRTVML LSQALMFSVA LCLVALAAAG 
AMTPARLLVC MFVGGCAGAM FQPAWQSAVT EQVPARELSA AIALDSFSMN FARTAGPALG 
GFIVASVSPN AAFVLSGLSY AGLIYVLSRS IRGAAARPPV RERLATMLVQ GVRYCGRARG 
IRGTLIRSSL FGFLGSPVWA LLPLFAKTQF GGEARTYGVL LASFGAGAAS GALGGAAGRA 
RLGREALVRL CTLTFAAGML ATAWSPCQAV AMLGLAVAGG SWVVVVSTYN LTIQTASPAW 
VAGRSLSLFH SFIVGGLSIG SYLWGVAAQG SSINSAFAVS ALMMAASACL AAWLPLPTHE 
ALGERTHGEP RRT