Gene BURPS1106A_1348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1348
Symbol
ID	4900598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1319434
End bp	1320459
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	640134578
Product	aliphatic sulfonate ABC transporter substrate-binding protein
Protein accession	YP_001065621
Protein GI	126452885
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCTG ACGACACGCC TCGCACCGCC CTTTCCCCCT CCGCTCACGA CGATACGCGC 
CGCTCGCTGC TGAAAGCAGC GGGCGCCGTC GCACTCGCCG CGCCGCTGCC CGGCGGCCTC 
GCCGCGCTAT CGGCGAGCGG CGCCGCCCAC GCGCAACGCA GTGCGAAAAC ACTGCGCATC 
GGTTACCAGA AGTACGGCAA CTTCGTCGTC CTGAAAGCGC GCGGCTCGCT CGAGAAGCGG 
CTCGCGGATC GGCATGTGTC GGTCCAGTGG ATCGAGTTTC CGGGCGGCCC GCAATTGCTC 
GAAGGCCTGA ACGCCGGCGC GATCGACGTC GGCACGGTCG GCGAAACGCC GCCCGTGTTC 
GCGCTCGCGG CGGGCGTCGA TTTCGTCTAC GTCGGCAGCG AACCGCCCGC GCCATTAGGC 
GAAGCCATCG TCGTGCCGCA CGATTCGCCG ATTCGCGCCG TCGCCGATCT GCGCGGCAGG 
AAGATTGCGC TCAACAAGGG CTCGAACGTT CACTACCTGC TCGTGAACGC GCTGCGGCGC 
GCGAAGATCG ATTACCGCGA CATCACGCCC GTCTACCTCG CGCCCGCCGA TGCACGCGCG 
GCATTCGCGC AGCGCGGCGT CGACGCCTGG GTGATTTGGG ACCCTTATCT TGCGGCGATC 
GAGCGTCAGA CGAACGCGCG CGCGATCGCG AATGGCGAAG GGCTCGTGAA CAACATCCAA 
TACTATCTCG CGAGCCGTAC GTTCGCCGAA GCCGAGCCGC AGCTCGTGCG CGCGCTGCTC 
GACGAAGTCG GCGCGGTCGA TCGTTGGGCG CGCGCGAATG TCGCCACTGT CGCCGCCCAG 
CTTTCGCCGC TCGTCGGGCT CGACACGGCA ACGCTCGAAC ACGCGTTGAA GCGCGCGAGC 
TATGGCGTGC AACCGATCGA CGACGCCGCG CTCGCGTATC AGCAGCGAAT CGCCGACACG 
TTCACCGCCC TCAAGCTGAT TCCGCGCAGG ATCGACGTCG CCGCCGCGCG CTGGCAAGCG 
GCATAG

Protein sequence

MTADDTPRTA LSPSAHDDTR RSLLKAAGAV ALAAPLPGGL AALSASGAAH AQRSAKTLRI 
GYQKYGNFVV LKARGSLEKR LADRHVSVQW IEFPGGPQLL EGLNAGAIDV GTVGETPPVF 
ALAAGVDFVY VGSEPPAPLG EAIVVPHDSP IRAVADLRGR KIALNKGSNV HYLLVNALRR 
AKIDYRDITP VYLAPADARA AFAQRGVDAW VIWDPYLAAI ERQTNARAIA NGEGLVNNIQ 
YYLASRTFAE AEPQLVRALL DEVGAVDRWA RANVATVAAQ LSPLVGLDTA TLEHALKRAS 
YGVQPIDDAA LAYQQRIADT FTALKLIPRR IDVAAARWQA A