Gene BURPS1106A_A0760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0760
Symbol
ID	4904089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	754131
End bp	755141
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	640143866
Product	quaternary amine ABC transporter periplasmic substrate-binding protein
Protein accession	YP_001074796
Protein GI	126455704
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAGGCCG CGCGGTTGAG TCGAAATCGC CTGCGCAATC CGTCGAACAG GGAGGCAACC 
ATGAAGTCCA CCACGACATT CGTATTCGGT GCGGCGCTCG CCGCGGCATG CGCGCTGCCG 
TCGCAATCCT TCGCGCAGGA CTCGGCCGCC TGCCGCAACG TGCGCTTCGC GGACATCGGC 
TGGACCGACA TCACGTCGAC GACGGCGCTC GCGTCGCTGC TGTTCGACGG TCTAGGCTAC 
AAGCCGACGA CGACGATCGC GTCCGTGCCG ATTTCGTTCG CAGGACTCAA GAACAGGCAG 
CTCGACGTAT CGCTCGGCTA CTGGTGGCCG GTGCAGCAGC ATCAGTTGCA GCCGTTCCTC 
GATTCGAAAT CGATCTCGGT GGTCGAGCCG CCGAACCTGT CGGGCGCGAA GGCGACGCTC 
GCGGTGCCGA GCTACGTGTA CCAGGCCGGG CTGAAATCGT TCGACGACAT CGCGAAGCAT 
CGCGCCGAGC TCGACGGCAA GATCTACGGG ATCGAGCCCG GCAGCAGCGC GAACGCGACG 
ATCCAGAAGA TGATCGATAC GAACCAGTAC GGGCTCGGCG GTTTCAAGCT CGTCGAATCG 
AGCGAGGCGG GGATGCTCGT CACGGTCGAG CGCGCGATCC GCGACAAGAA GTGGGTCGTG 
TTCCTCGGCT GGGAGCCGCA TCCGATGAAC ATCCAGATCG GCATGAACTA CCTGTCGGGC 
GGCGACGCGG CGTTCGGCCC GAACTACGGC GAAGCGCGCG TGTACACGCT GACGTCGCCC 
GATTACATGG CGCGCTGCCC GAACGCGGGC AAGCTCGTCG GCAATCTGCG CTTCACCACG 
CAAATGGAAA ACCAGCTGAT GCAGGCGGTG ATGAACAAGG TGAAGCCCGC GGAAGCGGCG 
AAGGCGTACA TCCGAAAGAA TCCGCAAGTG CTCGATGCGT GGCTTGCCGG CGTGAAGACC 
TACGACGGCA AGGACGGGCT GGCTGCGGTG AAGGCTTATC TGGGGCTCTG A

Protein sequence

MQAARLSRNR LRNPSNREAT MKSTTTFVFG AALAAACALP SQSFAQDSAA CRNVRFADIG 
WTDITSTTAL ASLLFDGLGY KPTTTIASVP ISFAGLKNRQ LDVSLGYWWP VQQHQLQPFL 
DSKSISVVEP PNLSGAKATL AVPSYVYQAG LKSFDDIAKH RAELDGKIYG IEPGSSANAT 
IQKMIDTNQY GLGGFKLVES SEAGMLVTVE RAIRDKKWVV FLGWEPHPMN IQIGMNYLSG 
GDAAFGPNYG EARVYTLTSP DYMARCPNAG KLVGNLRFTT QMENQLMQAV MNKVKPAEAA 
KAYIRKNPQV LDAWLAGVKT YDGKDGLAAV KAYLGL