Gene BURPS668_A0850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0850
Symbol
ID	4888808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	828559
End bp	829509
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	64%
IMG OID	640130790
Product	quaternary amine ABC transporter periplasmic substrate-binding protein
Protein accession	YP_001061849
Protein GI	126444696
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTCCA CCACGACATT CGTATTCGGC GCGGCGCTCG CCGCGGCATG CGCGCTGCCG 
TCGCAATCCT TCGCGCAGGA CTCGGCCGCC TGCCGCAACG TGCGCTTCGC GGACATCGGC 
TGGACCGACA TCACGTCGAC GACGGCGCTC GCGTCGCTGC TGTTCGACGG TCTAGGCTAC 
AAGCCGACGA CGACGATCGC GTCCGTGCCG ATTTCGTTCG CAGGACTCAA GAACAGGCAG 
CTCGACGTAT CGCTCGGCTA CTGGTGGCCG GTGCAGCAGC ATCAGTTGCA GCCGTTCCTC 
GATTCGAAAT CGATCTCGGT GGTCGAGCCG CCGAACCTGT CGGGCGCGAA GGCGACGCTC 
GCGGTGCCGA GCTACGTGTA CCAGGCCGGG CTGAAATCGT TCGACGACGT CGCGAAGCAT 
CGCGCCGAGC TCGATGGCAA GATCTATGGG ATCGAGCCCG GCAGCAGCGC GAACGCGATG 
ATCCAGAAGA TGATCGACAC GAACCAGTAC GGGCTCGGCG GCTTCAAGCT CGTCGAATCG 
AGCGAGGCGG GGATGCTCGT CACGGTCGAG CGCGCGATCC GCGACAAGAA GTGGGTCGTG 
TTCCTCGGCT GGGAGCCGCA TCCGATGAAC ATCCAGATCG GCATGAACTA CCTGTCGGGC 
GGCGACGCGG CGTTCGGCCC GAACTACGGC GAAGCGCGCG TGTACACGCT GACGTCGCCC 
GATTACATGG CGCGCTGCCC GAACGCGGGC AAGCTCGTCG GCAATCTGCG CTTCACCACG 
CAGATGGAAA ACCAGCTGAT GCAGGCGGTG ATGAACAAGG TGAAGCCCGC GGAAGCGGCG 
AAGGCGTACA TCCGAAAGAA TCCGCAAGTG CTCGATGCGT GGCTTGCCGG CGTGAAGACC 
TACGACGGCA AGGACGGGCT GGCTGCGGTG AAGGCTTATC TGGGGCTCTG A

Protein sequence

MKSTTTFVFG AALAAACALP SQSFAQDSAA CRNVRFADIG WTDITSTTAL ASLLFDGLGY 
KPTTTIASVP ISFAGLKNRQ LDVSLGYWWP VQQHQLQPFL DSKSISVVEP PNLSGAKATL 
AVPSYVYQAG LKSFDDVAKH RAELDGKIYG IEPGSSANAM IQKMIDTNQY GLGGFKLVES 
SEAGMLVTVE RAIRDKKWVV FLGWEPHPMN IQIGMNYLSG GDAAFGPNYG EARVYTLTSP 
DYMARCPNAG KLVGNLRFTT QMENQLMQAV MNKVKPAEAA KAYIRKNPQV LDAWLAGVKT 
YDGKDGLAAV KAYLGL