Gene BURPS668_3448 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3448
Symbol
ID	4882679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3373772
End bp	3374767
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	640129376
Product	carbohydrate ABC transporter periplasmic sugar-binding protein
Protein accession	YP_001060459
Protein GI	126442265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA GAACGTTCAT CACGCTGGCG GCAGCGGCGA CGGTCGCGGC GGCGGGCCTG 
CCCGCGCAGG CGGCCGAGCC CGTGAAGATC GGCTTCCTCG TCAAGCAGCC CGAGGAGCCG 
TGGTTCCAGG ACGAATGGAA ATTCGCCGAG CTCGCCGCGA AGGACAAGGG CTTCACGCTC 
GTGAAGATCG GCGCGCCGTC CGGCGAGAAG GTGATGAGCG CGATCGACAA TCTCGCCGCG 
CAGAAGGCGC AGGGCTTCAT CATCTGCACG CCGGACGTGA AGCTCGGGCC GGGCATCGTC 
GCGAAGGCGA AGTCGCACGG CCTGAAGATG ATGACGGTCG ACGACCGGCT CGTCGACGGC 
GCGGGCAAGC CGATCGAATC GGTTCCGCAC ATGGGCATTT CCGCGTACGA CATCGGCAAG 
CAGGTCGGCG GCGGGATCGC GGCCGAGATC AAGAGGCGCG GCTGGAACAT GAACGAAGTC 
GGCGCGATCG ACATCACGTA CGAGCAGTTG CCGACCGCGC ACGACCGCAC GACGGGCGCG 
ACCGACGCGC TCGTCGCCGC GGGCTTTCCG AAGGCGAACG TGATTGCCGC GCCGCAGGCG 
AAGACCGACA CCGAGAACGC GTTCAACGCG GCGAACATCG CGCTCACGAA GAATCCGCAG 
TTCAAGCACT GGGTCGCCTA CGGCCTGAAC GACGAAGCGG TGCTCGGCGC GGTGCGCGCG 
GCCGAAGGGC GCGGCTTCAA GGCGGCCGAC ATGATCGGCA TCGGCATCGG CGGCTCGGAC 
TCGGCGCTCA GCGAGTTCAA GAAGCCGCAG CCGACCGGCT TCTTCGGCAC CGTGATCATC 
AGCCCGAAGC GGCACGGCGA GGAGACTTCC GAGCTGATGT ACGCGTGGAT CACGCAAGGC 
AAGGCGCCGC CGCCGCTCAC GCTGACGACG GGCATGCTCG CGACGCGCGA GAACGTCGCG 
CAGGTGCGCG AGACGATGGG GCTCGCGGCG AAGTGA

Protein sequence

MKRRTFITLA AAATVAAAGL PAQAAEPVKI GFLVKQPEEP WFQDEWKFAE LAAKDKGFTL 
VKIGAPSGEK VMSAIDNLAA QKAQGFIICT PDVKLGPGIV AKAKSHGLKM MTVDDRLVDG 
AGKPIESVPH MGISAYDIGK QVGGGIAAEI KRRGWNMNEV GAIDITYEQL PTAHDRTTGA 
TDALVAAGFP KANVIAAPQA KTDTENAFNA ANIALTKNPQ FKHWVAYGLN DEAVLGAVRA 
AEGRGFKAAD MIGIGIGGSD SALSEFKKPQ PTGFFGTVII SPKRHGEETS ELMYAWITQG 
KAPPPLTLTT GMLATRENVA QVRETMGLAA K