Gene BURPS1106A_2547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2547
Symbol
ID	4900276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2501035
End bp	2502987
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	71%
IMG OID	640135774
Product	ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001066801
Protein GI	126453009
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.524722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATCG GTTCGCCCCG GGCCCGCCGG CCGCGATCGC CGCAACGCGC GGCGCCATCA 
GAACAGGCCG CGCGCGCCGC CGCGCCGCGA CGGGCGGCCC GCGCGCGCGC CGCGCTCGCG 
CGCTTCGCGC GCCGGGCGGC GGCGGGCGTC GCGCTCGCCT TCGTCGCGGC GCCCGCGGCG 
CACGCCGTCT ACGCGATCGC GCAGTACGGC GAGCCGAAGT ATCCGGCGGG CTTCGCGCAT 
TTCGACTACG TGAACCCCGA CGCGCCGAAG GGCGGCACGC TCGTGCTCGC GAACCCGAAC 
CGGCTCACGA CGTTCGACAA GTTCAATCCG TTCACGATGC GCGGCAACCC GGCGCCCGGA 
ATCGACCTGC TGTTCGAGAG CCTGACGACG GGCAGCGCCG ACGAGCCCGC CTCCGCGTAC 
GGCCTGCTCG CGGACGACAT CGCCGTCGCG CCGGACGGCC TGTCGGTCAC GTTCCATCTG 
AATCCGCGCG CGCGCTTCTC GAACGGAGAA CCCGTCACCG CGGCGGACGT CAAGTATTCG 
TTCGACACGC TGAAGAGCCC GAAGGCGGCG CCGCAATACC CGGCGTACTA CGCGGACATC 
GCGCGCGCGG TGATCGTCGA CGCGGCGACC GTGCGCTTCG AGTTTCGCCG CAAGAACCGC 
GAGCTGCCGC TGATCGCGGG CGGCATCCCG GTGTTCTCGC GCAAATGGGG CGTGCGCGCG 
GACGGCTCGC GCATCGCGTT CGACCAGATC GCGTTCGAGC AGCCGATCGG CAGCGGCCCG 
TACCTGATCG AGCGCTACGA CAGCGGGCGC ACGATCACGT ACCGGCGCAA TCCCGCCTAC 
TGGGGCGCGG CGCTGCCCGT GCGGATCGGC ACGAACAACT TCGAGCGCAT CGTCTACAAG 
CTGTACGGCG ACGGCGTCGC GCGGCTCGAG GCGTTCAAGG CCGGCGAATA CGACGTGCTC 
GTCGAGTACA TCGCGCGCAA CTGGGCGCGG CGCGACGTCG GCAAGCGCTT CGACAGCGGC 
GAGCTCGTCA AGCGCGAGTT CCGCCAGCAC AACGGCGCGG GAATGCAGGG CTTCTTCATG 
AACCTGCGCC GGCCGCTGTT CCAGGACGTG CGCGTGCGCC ACGCGCTCGA TCTCGCGTTC 
GATTTCGAAT GGCTGAACCG GCAGCTTTTC TATGGCGCGT ACACGCGCCT GAACAGCTAT 
TTCGCCGATA CCGACCTGCA GGCGACGGGC ACGCCGAGCG CGGGCGAGCT CGCGCTGCTC 
GCCCCGTTGC GCGCGCAGCT CGACCCGGCC GTGTTCGGGC CGATGACCGT GCAGCCGAGC 
ACCGATTTGC CCGCGTCGCT GCGCGCGAAC CTGCTGAAGG CGCGCGCGCT GCTCGCCGAG 
GCCGGCTGGA CCTACCGCGA CGGCGCGCTG CGCAACGCGA AGGGCGAGCC GTTCGTGTTC 
GAGATTCTCG ACGATTCGGG CTCGGCGTTC GAGCCGGTGG TCGCCGCGTA CATCCGCAAT 
CTCGCGAAGC TCGGGATCGT CGCGAAGTAC CGGACGGCCG ATTTCGCGCT GCTGCAAAAG 
CGCCTCGACG CGTTCGACTA CGACATGACG ACGGTCCGCT ACCCGGGCGT CCAGGTGCCG 
GGCGCCGAGC AGGTCGCACG CTTCGCGAGC CGCTATGCGG ACGAGCCGGG CTCGGACAAC 
CTGACGGGGC TCAAGTCGCC CGCGGTCGAC GCGATCCTGA AGGCGCTCAC GCAGGCCGAG 
ACGCGCGACG AACTGCTCGA CGCGACGCAC GCGCTCGACC GCGTGCTGAT GCACGGCTAC 
TATGCGGTGC CGCAGTGGTA CAGCGCCGTG CACCGGATCG CGTTCAAGCG CACGCTCGCC 
TACCCGTCGG TGCTGCCGCT GTACTATTCG GCGGAAGGCT GGGTCGCCTC GACGTGGTGG 
GCGAGGCCCG AGCATGGCGC GTCCGCGCGT TAG

Protein sequence

MTIGSPRARR PRSPQRAAPS EQAARAAAPR RAARARAALA RFARRAAAGV ALAFVAAPAA 
HAVYAIAQYG EPKYPAGFAH FDYVNPDAPK GGTLVLANPN RLTTFDKFNP FTMRGNPAPG 
IDLLFESLTT GSADEPASAY GLLADDIAVA PDGLSVTFHL NPRARFSNGE PVTAADVKYS 
FDTLKSPKAA PQYPAYYADI ARAVIVDAAT VRFEFRRKNR ELPLIAGGIP VFSRKWGVRA 
DGSRIAFDQI AFEQPIGSGP YLIERYDSGR TITYRRNPAY WGAALPVRIG TNNFERIVYK 
LYGDGVARLE AFKAGEYDVL VEYIARNWAR RDVGKRFDSG ELVKREFRQH NGAGMQGFFM 
NLRRPLFQDV RVRHALDLAF DFEWLNRQLF YGAYTRLNSY FADTDLQATG TPSAGELALL 
APLRAQLDPA VFGPMTVQPS TDLPASLRAN LLKARALLAE AGWTYRDGAL RNAKGEPFVF 
EILDDSGSAF EPVVAAYIRN LAKLGIVAKY RTADFALLQK RLDAFDYDMT TVRYPGVQVP 
GAEQVARFAS RYADEPGSDN LTGLKSPAVD AILKALTQAE TRDELLDATH ALDRVLMHGY 
YAVPQWYSAV HRIAFKRTLA YPSVLPLYYS AEGWVASTWW ARPEHGASAR