Gene BURPS1106A_3052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3052
Symbol
ID	4899205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2980507
End bp	2981754
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	66%
IMG OID	640136278
Product	carbohydrate ABC transporter periplasmic binding protein
Protein accession	YP_001067291
Protein GI	126452555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTC GCGCGATCAT GGGCGCGCTC GGCGCCGCAG GCCTGTTGTT CGGCGCTGCC 
GCAGCGCAAG CGGCAGAGAA TGTCACGGTG CTGCACTGGT GGACGTCGGG CGGCGAATCG 
AAGGCGGTCG GCGTGCTGAA GGACGACCTG CAGAAGCAGG GCTACGTCTG GAAGGATTTC 
GCGGTGGCGG GCGGCGCGGG CGCCGCGGCG ATGACCGCGC TGAAGACGAA GGTCATCAGC 
GGCGACGCGC CGTCGGCCGC GCAGATCAAG GGGCCGCTGA TCCAGGAATG GGCGGACCAG 
GGCGTGCTCG TGAACATCGA CGCGGCCGCG GGCGACTGGA AGCAGAACCT GCCGCCCGAG 
ATCGACAAGA TCATCAAGTA CAAGGGCAAC ACCGTCGCGG CGCCGTTCTC GGTGCACCGC 
GTGAACTGGC TCTACATCAA CAAGGCCGCG CTCGACAAGA TCGGCGCGAA GCCGCCCGCG 
ACGTGGCCGG AATTCTTCCA GGTGGCCGAC AAGCTGAAGG CGGCGGGCAT CCAGCCGGTC 
GCGATGGGCG GCCAGCCGTG GCAGGACCTG ACGCTGTGGG AAGACGTCGT GCTCTCGCAA 
GGCGCCGACT TCTACAGGAA GGCGCTCGTC GAGCTCGACC AGAAGACGCT CACGTCGGAC 
AAGATGCTCG AAGTCTTCAA CACCGTCCGC AAGATCCAGG GCTACTTCGA TTCGGGCCGC 
AACGGCCGCG ACTGGAATCT GGCCACGGCG ATGGTGATCA ACGGCCGCGC CGGCATGCAG 
TTCATGGGCG ACTGGGCGAA GGGCGAGTTC GAGGCGGCCG GCAAGAAGCC GGGCAAGGAC 
TATATCTGCG CGGCGGTGCC GGGCACGGCG AATGCGTACA CGTTCAACGT CGATTCGTTC 
GTGTTCTTCC AGCAGAAGGG CCAGAAGGCG GCCACGCCCG GCCAGATCGC GCTCGCCAAG 
ACGATCATGA CGCCCGCGTT CCAGGAGCAA TTCAGCTTGC TGAAGGGTTC GATCCCGGTG 
CGCCTCGGCG TGAAGATGGA CAAGTTCGAC GATTGCGCGA AGAAGTCCTA CGCCGACGAG 
CAGACGGCGA TCAAATCGGG CGGCTACGTG CCGTCGCTCG CGCACGGCAT GGCGCAGGGC 
GACGCGACCG CGGGCGCGAT TTCCGACGTC GTGACGAAGT TCATGAACTC GCAGCAGGAC 
GCGAAGAGCG CGCTCGCCGC GCTCGCGCGC GCCGCGAAGG TGAAGTAA

Protein sequence

MKIRAIMGAL GAAGLLFGAA AAQAAENVTV LHWWTSGGES KAVGVLKDDL QKQGYVWKDF 
AVAGGAGAAA MTALKTKVIS GDAPSAAQIK GPLIQEWADQ GVLVNIDAAA GDWKQNLPPE 
IDKIIKYKGN TVAAPFSVHR VNWLYINKAA LDKIGAKPPA TWPEFFQVAD KLKAAGIQPV 
AMGGQPWQDL TLWEDVVLSQ GADFYRKALV ELDQKTLTSD KMLEVFNTVR KIQGYFDSGR 
NGRDWNLATA MVINGRAGMQ FMGDWAKGEF EAAGKKPGKD YICAAVPGTA NAYTFNVDSF 
VFFQQKGQKA ATPGQIALAK TIMTPAFQEQ FSLLKGSIPV RLGVKMDKFD DCAKKSYADE 
QTAIKSGGYV PSLAHGMAQG DATAGAISDV VTKFMNSQQD AKSALAALAR AAKVK