Gene BURPS1106A_A1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1075
Symbol
ID	4903805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1033887
End bp	1034900
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	68%
IMG OID	640144181
Product	carbohydrate ABC transporter periplasmic sugar-binding protein
Protein accession	YP_001075110
Protein GI	126455764
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTGGA TCAATCGCGG GCGAGCATTC GCCGGATGCG TCGCGCTGGC GGGCGCGCTC 
GCCGCCGCGC CGGCGGGCGC GGACACGGGC AAGGTCGGGC TCGACCTGCC TTTGCTGACC 
TCGCCGTTCT GGCAGTCGTA CAACCGCTAC CTGCTGCATT ACGCGAAGGA CATGCAGATC 
GATGCGCTCG CGCCCGTCAA TTCGAACGGC GATCCCGCGC AGCAGATCAC GGACATGAAC 
ACCCTGCTGA ATCTCGGCGC GAAGGGCATC GTCGTCGGCC CGCTCGATTC GGCGGCGATC 
GGCCGCGCGC TCGATGCGGC GGCCGCGCGC AACGTGCCCG TCGTCGCCGT CGACGTCGCG 
CCGACGCAGG GCAAGGTCGC GATGGTCGTG CGCGCCGACA ATCGCGCGTA CGGCGAGAAG 
GCGTGCCAGT ATCTCGGCGA GCACGTGCGC CGCGGCAAGG TCGTGCAGAT CATGGGCGAT 
CTCGCGTCGG TGAACGGCCG CGATCGCTCG GAGGCGTTCC GCGCATGCAT GAAGGGCTAT 
CCGAACCTGC AGGTGCTCGA GATTCCGGCC GCCTGGAAGG GCGACGTCGC CGCGACCGCG 
CTCGACAGCC TGCTGAGCGC GAATCCGGAC GTGAAGGGCA TCTACCTGCA GGCGGGCGGC 
GTCTATCTGT CGCCGACGCT GCAAACGCTG CGCCGCAAGC AGATGCTGTA TCCGGCGGGT 
GACGCGAAGC ACGTCGCGAT CGTCAGCAAC GACGGCATCC CGCAGGAATA CGAAGCGATC 
CGCCGCGGCG ACATCGACGC CACCGTGTCG CAGCCGGCCG ATCTGTACGC GCGCTACGGG 
CTTTTCTACA TCAAGGCGGC GCTCGCCGGC CGAACCTTCA AGCCGGGGCC GACCGATCAC 
GGCAGCGTGA TCGTGCAGCG CGCGCCCGGC GTGCTCGAGG ATCAGTTGCC GGCGCCGCTC 
GTGACGAAGG CGAACGTCGA CGACAAGGGC CTGTGGGGCA ACACGATCAA ATGA

Protein sequence

MTWINRGRAF AGCVALAGAL AAAPAGADTG KVGLDLPLLT SPFWQSYNRY LLHYAKDMQI 
DALAPVNSNG DPAQQITDMN TLLNLGAKGI VVGPLDSAAI GRALDAAAAR NVPVVAVDVA 
PTQGKVAMVV RADNRAYGEK ACQYLGEHVR RGKVVQIMGD LASVNGRDRS EAFRACMKGY 
PNLQVLEIPA AWKGDVAATA LDSLLSANPD VKGIYLQAGG VYLSPTLQTL RRKQMLYPAG 
DAKHVAIVSN DGIPQEYEAI RRGDIDATVS QPADLYARYG LFYIKAALAG RTFKPGPTDH 
GSVIVQRAPG VLEDQLPAPL VTKANVDDKG LWGNTIK