Gene BURPS668_1342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1342
Symbol
ID	4883678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1309135
End bp	1310160
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	640127270
Product	aliphatic sulfonate ABC transporter substrate-binding protein
Protein accession	YP_001058385
Protein GI	126442224
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCTG ACGACACGCC TCGCACCGCC CTTTCCCCCT CCGCTCACGA CGATACGCGC 
CGCTCGCTGC TGAAAGCAGC GGGCGCCGTC GCACTCGCCG CGCCGCTGCC CGGCGGCCTC 
GCCGCGCTAT CGGCGAGCGG CGCCGCCCAC GCGCAACGCA GTGCGAAAAC GCTGCGCATC 
GGTTACCAGA AGTACGGCAA CTTCGTCGTC CTGAAAGCGC GCGGCTCGCT CGAGAAGCGG 
CTCGCGGATC GGCATGTGTC GGTCCAGTGG ATCGAGTTTC CGGGCGGCCC GCAATTGCTC 
GAAGGCTTGA ACGCCGGCGC GATCGACGTC GGCACGGTCG GCGAAACGCC GCCCGTGTTC 
GCGCTCGCGG CGGGCGTCGA TTTCGTCTAC GTCGGCAGCG AACCGCCCGC GCCATTAGGC 
GAAGCCATCG TCGTGCCGCA CGATTCGCCG ATTCGCGCCG TCGCCGATCT GCGCGGCAGG 
AAGATTGCGC TCAACAAGGG CTCGAACGTT CACTACCTGC TCGTGAACGC GCTGCGGCGC 
GCGAAGATCG ATTACCGCGA CATCACGCCC GTCTACCTCG CGCCCGCCGA TGCACGCGCG 
GCATTCGCGC AGCGCGGGGT CGACGCCTGG GTGATTTGGG ACCCTTATCT TGCGGCGATC 
GAGCGTCAGA CGAACGCGCG CGCGATCGCG AATGGCGAAG GGCTCGTGAA CAACATCCAA 
TACTATCTCG CGAGCCGTAC GTTCGCCGAA GCCGAGCCGC AGCTCGTGCG CGCGCTGCTC 
GACGAAGTCG GCGCGGTCGA TCGTTGGGCG CGCGCGAATG TCGCCACTGT CGCCGCCCAG 
CTTTCGCCGC TCGTCGGGCT CGACACGGCA ACGCTCGAAC GCGCGTTGAA GCGCGCGAGC 
TATGGCGTGC AACCGATCGA CGACGCCGCG CTCGCGTATC AGCAGCGAAT CGCCGACACG 
TTCACCGCCC TCAAGCTGAT TCCGCGCAGG ATCGACGTCG CCGCCGCGCG CTGGCAAGCG 
GCATAG

Protein sequence

MTADDTPRTA LSPSAHDDTR RSLLKAAGAV ALAAPLPGGL AALSASGAAH AQRSAKTLRI 
GYQKYGNFVV LKARGSLEKR LADRHVSVQW IEFPGGPQLL EGLNAGAIDV GTVGETPPVF 
ALAAGVDFVY VGSEPPAPLG EAIVVPHDSP IRAVADLRGR KIALNKGSNV HYLLVNALRR 
AKIDYRDITP VYLAPADARA AFAQRGVDAW VIWDPYLAAI ERQTNARAIA NGEGLVNNIQ 
YYLASRTFAE AEPQLVRALL DEVGAVDRWA RANVATVAAQ LSPLVGLDTA TLERALKRAS 
YGVQPIDDAA LAYQQRIADT FTALKLIPRR IDVAAARWQA A