Gene BURPS668_A1470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1470
Symbol
ID	4887782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1369202
End bp	1370461
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	64%
IMG OID	640131409
Product	putative polyketide biosynthesis protein pksG
Protein accession	YP_001062467
Protein GI	126443435
COG category	[I] Lipid transport and metabolism
COG ID	[COG3425] 3-hydroxy-3-methylglutaryl CoA synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0349844
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCCG TTGGTATTGA GGCGCTCAAC GTTTATGCCG GGGTTGCCAG TCTCGACGTC 
TCGAGGCTGG CGGAGCATCG CAAGCTGGAC ATGGCGAGAT TCCAGAACCT GCTGATGCGG 
GAAAAATCGG TTGCGCTGCC CTATGAGGAT CCGATCACCT ATGGCGTCAA CGCCGCCAAG 
CCGATCGTCG ACGCGCTGAC GCCCGACGAG CGCGACCGCA TCGAAATGCT GATCACCTGC 
ACCGAATCGG CATTCGATTT CGGCAAATCG ATGAGCACCT ACTTTCACCA CCATCTCGGC 
CTGAAGCGCA ACTGCCGCCT GTTCGAAGTC AAGAACGCGT GCTACTCCGG CGTCGCCGGC 
CTGCAAACGG CGATCAACTT CATCCTGGCC CAGGTCTCGC CCGGCGCGAA GGCGCTCGTG 
ATCGCGACCG ACCTGTCGCG CTTCATCGTC GAGGAAGGCG GCGAGGCCTT GTCCGCCGAC 
TGGTCGTTCG CCGAGCCGAG CAGCGGCGCG GGCGCGGTCG CGATGCTCGT CAGCGACACG 
CCGCACGTGT TTCGCATCGA CGTCGGCGCG AACGGGTACT ACGGCTACGA GGTGATGGAC 
ACCTGCCGGC CGACCACCGA TAGCGAAGCC GGCAATTCGG ATCTGTCGCT CCTGTCGTAT 
CTCGACTGCT GCGAAAACGC GTTCCTCGAA TACCAGAAGC GCGTGTGCGA CGTCGATTAC 
GCGAGCACGT TCGGATTCCT CGCTTTTCAC ACGCCGTTCG GCGGCATGGT GAAGGGCGCG 
CACCGCAATC TGATGCGCAA GGCGAGCCGC TGCTCGACGC AGGAAATCGA GCAGGACTTC 
CAGCGCCGCG CGGGCCCCGG GCTCGTCTAC TGCCAGCGGC TCGGCAACAT CATGGGTGCG 
ACGGCGATGC TGTCGGTCGC CAGCACGATC GACAACGGCG AGTATCGCGC GCCGCAGCGC 
GTGGGCGTGT TCTCGTACGG CTCGGGCTGC TGCTCGGAGT TCTTCAGCGG CATCGTCGAC 
GAGGAAGGCC AGCGCCGGCT GCGCGGCATG CGCATCGGCG AGCAGTTGGA CCGCCGCTAC 
GCGCTGTCCA TCGACGAATA CGAGCACGTG CTCAAGGAAA GCCGGGTCGT GCGCTTCGGC 
ACCCGCAACG CGAAAATCGA CGACGGCTTC ATCCCCGCGG CGCGGCGCGC GCACGGCCGC 
GAAACGCTCT TCCTGAGCCG GATCAACGAA TACCATCGGG AATACGAATG GATATGCTGA

Protein sequence

MTAVGIEALN VYAGVASLDV SRLAEHRKLD MARFQNLLMR EKSVALPYED PITYGVNAAK 
PIVDALTPDE RDRIEMLITC TESAFDFGKS MSTYFHHHLG LKRNCRLFEV KNACYSGVAG 
LQTAINFILA QVSPGAKALV IATDLSRFIV EEGGEALSAD WSFAEPSSGA GAVAMLVSDT 
PHVFRIDVGA NGYYGYEVMD TCRPTTDSEA GNSDLSLLSY LDCCENAFLE YQKRVCDVDY 
ASTFGFLAFH TPFGGMVKGA HRNLMRKASR CSTQEIEQDF QRRAGPGLVY CQRLGNIMGA 
TAMLSVASTI DNGEYRAPQR VGVFSYGSGC CSEFFSGIVD EEGQRRLRGM RIGEQLDRRY 
ALSIDEYEHV LKESRVVRFG TRNAKIDDGF IPAARRAHGR ETLFLSRINE YHREYEWIC