Gene BURPS1106A_1680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1680
Symbol
ID	4902392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1635446
End bp	1636558
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	65%
IMG OID	640134910
Product	carbohydrate ABC transporter periplasmic sugar-binding protein
Protein accession	YP_001065951
Protein GI	126453990
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.824085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTCGTGA ACGCGGCCCG ACCCGCGTTC GCCCGAAAAC GACAGACAGA GAAAGGTGGA 
GACATGAGAC TTTGCACTGG CAAGGCCGTC CTGCGCGCAT GCGTCGCCGC GATCGCCGTC 
GCGGCGGGCG TGGGCGGCGC GGCCCCGGCA GCCCAGGCGG CGGGCGCGCG CTTCGCGCTC 
GTGAGCCACG CGCCCGATTC CGATTCGTGG TGGAACACGA TCAAGAACGC GATCAAGCAG 
GCGGACGAGG ATTTCGATGT CACGACCGAT TACCGCAATC CGCCGAACGG CGACATCGCC 
GACATGGCGC GCCTGATCGA GCAATCGGCC GCGCGCGACT ACGACGGCGT GATCACGACG 
ATCGCCGATT ACGACGTGCT GAAGAATTCG CTGAGGAAAG TCACCGCGAA GAAGATCCCG 
CTCGTGACGA TCAACTCCGG CACCGAAGAA CAGAGCGCGC AACTGGGCGC GATCATGCAT 
GTCGGCCAGC CCGAGTACGT CGCGGGTCAC GCGGCGGGCG AGAAGGCGAA GGCGGCCGGC 
GTGAAGCGCT TCCTCTGCGT GAACCACATC GCGACCAACA GCGTGTCGTT CGACCGCTGT 
CGCGGCTTCG CCGACGCGAT CGGCGCCGAC TACAAGAGCT CGACGATCGA CTCCGGCCAG 
GACCCGACCG AGATCCAGTC GAAGGTGAGC GCGTACCTGC GCAACCATCC GAACACGCAG 
GCGATCCTCA CGCTCGGCCC GGTGCCCGCC GCGGCGTCGC TGAAGGCGGT GCAGCAGATG 
GGCCTCGCGA ACAAGCTGTT CTTCGCGACG TTCGATTTCT CCGACGACAT CGCGAAGGCG 
ATCCAGAGCG GCGCGATCAA GTTCGCGATC GACCAGCAGC CATACCTGCA GGGCTACATC 
CCGGTGGCCG TGCTCGCGAT CGCGAAGCAG AACAAGACCA CCGATCCCGC GAAGATCCGC 
CAGATCCTCG AGGCGAACCC GAAATTCCAG GCGCGGCTGT CGACCTACGG GCTGCAGCCG 
TCGTACGGGC CGAAGAACAT CCGCTCGGGC CCGGGCTTCA TCACGAAGGA GAACCTCGAG 
AAGGTGATCA AGTACGCGGG CCAGTACCGC TAA

Protein sequence

MLVNAARPAF ARKRQTEKGG DMRLCTGKAV LRACVAAIAV AAGVGGAAPA AQAAGARFAL 
VSHAPDSDSW WNTIKNAIKQ ADEDFDVTTD YRNPPNGDIA DMARLIEQSA ARDYDGVITT 
IADYDVLKNS LRKVTAKKIP LVTINSGTEE QSAQLGAIMH VGQPEYVAGH AAGEKAKAAG 
VKRFLCVNHI ATNSVSFDRC RGFADAIGAD YKSSTIDSGQ DPTEIQSKVS AYLRNHPNTQ 
AILTLGPVPA AASLKAVQQM GLANKLFFAT FDFSDDIAKA IQSGAIKFAI DQQPYLQGYI 
PVAVLAIAKQ NKTTDPAKIR QILEANPKFQ ARLSTYGLQP SYGPKNIRSG PGFITKENLE 
KVIKYAGQYR