Gene BURPS1106A_0522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0522
Symbol
ID	4900682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	484673
End bp	485644
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	67%
IMG OID	640133752
Product	putative ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001064805
Protein GI	126452786
COG category	[R] General function prediction only
COG ID	[COG2984] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAT TCAAGATCGT GGCCGCTCAT TCGATCGCGG CGGGCGTCGC GGCGTTCGCG 
ATGCTGGGCG CCGGCGCCGC GCACGCGCAG ACCGTCAAGG TGCTGTCGAT CGTCGATCAT 
CCGGCGCTCG ACGCGATCCG CGACGGCGTG CGCGCGCAGC TGAAGGCCGA AGGCTACGGC 
GACGACAAGC TCAAGTGGGA ATACCAGAGC GCGCAGGGCA ACACCGGCAC CGCCGCGCAG 
ATCGCGCGCA AGTTCATCGG CGACCGTCCG GACGTGATCG TCGCGATCGC GACGCCCGCC 
GCGCAAGCCG TCGTCGCATC GACGAAGACC GTGCCTGTCG TCTATTCGGG CGTGACCGAT 
CCCGTTGCCG CGCAGCTCGT CAAGGGCTGG GGGCCGACGG GTACCAACGT GACGGGCGTG 
TCCGACCAGC TGCCGCTCGA CCGGCAGGTC GCGCTCATCA AGCGCGTGGT GCCGAAGGTG 
AAGACGGTCG GGATGGTCTA CAACCCGGGC GAGGCAAACT CGGTCGTCGT CGTGAAGGCG 
CTCAAGGAGA TCCTCGCGAA GCAGGGGATG ACGCTCAAGG AGGCGGCCGC GCCGCGCACC 
GTCGACATCG CGCCCGCCGC GAAGAGCCTG ATCGGCAAGG TCGACGTGAT CTATACGAAC 
ACCGACAACA ACGTCGTGTC CGCATACGAA TCGCTCGTGA AGGTCGCGAA CGAGGCGAAG 
ATCCCGCTCG TCGCGGGCGA CACCGACAGC GTGAAGCGCG GCGGCATCGC GGCGCTCGGC 
ATCAACTACG GCGACCTCGG CCGGCAGACG GGCAAGGTCG TCGCGCGGAT CCTGAAGGGC 
GAGAAGCCGG GCGCGATCGC ATCGGAGACG AGCAGCAATC TCGAGCTGTT CGTGAACACC 
GACGCGGCCG CCAAGCAGGG CGTGACGCTT GCGCCCGATC TCGTCAAGGA AGCGAAGACG 
GTCATCAAGT AA

Protein sequence

MKRFKIVAAH SIAAGVAAFA MLGAGAAHAQ TVKVLSIVDH PALDAIRDGV RAQLKAEGYG 
DDKLKWEYQS AQGNTGTAAQ IARKFIGDRP DVIVAIATPA AQAVVASTKT VPVVYSGVTD 
PVAAQLVKGW GPTGTNVTGV SDQLPLDRQV ALIKRVVPKV KTVGMVYNPG EANSVVVVKA 
LKEILAKQGM TLKEAAAPRT VDIAPAAKSL IGKVDVIYTN TDNNVVSAYE SLVKVANEAK 
IPLVAGDTDS VKRGGIAALG INYGDLGRQT GKVVARILKG EKPGAIASET SSNLELFVNT 
DAAAKQGVTL APDLVKEAKT VIK