Gene BURPS668_0518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0518
Symbol
ID	4882586
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	486407
End bp	487474
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	70%
IMG OID	640126446
Product	putative syringomycin biosynthesis enzyme
Protein accession	YP_001057571
Protein GI	126441499
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2175] Probable taurine catabolism dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.923384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGA TCCGGGATTC GATCACCTTC CAGAACGCGG CGGCGCTCAA GGCGCAGGCG 
CGGCTCGGCC CCGGCGTGAT CTGCGGCCTG CGCTCCGAGC GCGCGCCGCT GCCGCTCGTC 
GTCTCGCCGC ACGGCGACAG CGCGCTCGCC GCGGACCGCG ACGCGGCGCT CGCGTGGTTC 
GACGCGCGCC GCGCGGCATT CGACGCGCTG CTGCTCGAGC ACGGCGGCCT GCTGCTGCGC 
GGCTTCGCGG TGCCCGACAC GCACGCGTTT CGCGCGCTGA CCGACCGCTA TCCGCCGCAC 
GCGTTCGGCT ACATCGCCGG CGCGTCGCCG CGCAAGGCGA TCGACGGCAA CGTGTACGAA 
TCGACGCATC TGCCCGCGCC GTACAAGCTG AGCCTGCATC AGGAAAAGGC GTACATGTCG 
CACTATCCGC GGCTCATCGC GTTCTACTGC CGGCAGGCCG CGGCCGTCGG CGGCGAAACG 
CCGCTGTCGG ACATGCGCGC CGTCACGCGC CGCCTGCCCG CGCGCACGCT CGAGCGGTTC 
CGCGGCAAGG GCGTGATGTA CCGGCGCAAC TTCTCGGCGA AGCCGATGCC CGCGCACTTC 
AACCAGTTCT ACCGGCGCTG GCAGGACGCG TTCATGACCG ACGAGCGCGC CGAAGTCGAA 
TCGCTCTGCC GCGCGACGCA GCTCGAATAC GAGTGGCTGC CCGACGGCAG CCTTACGGTC 
ACGCACGTGG GCCCGGCGAC GGTCGTGCAT CCGCGCACGG GCGACGAAGT GTGGTTCAAC 
CATGCGAGCA CGCAGCACAT CAACGCGCGC GTCGTGCACC CGACGATCCT GCGCGCGCTG 
CAGTCGTTCT ACAAGACGCG CGCCGCGCTG CCGTACGACA TCCGCTACGG CGACGGCACG 
CCGATGCCCG CCGAAGACCT CGATCCCGTC TACGACGCGA TCGACGCCGA GGAGACCGCG 
TTTCGCTGGC GCGAGCAGGA CGTGCTGCTG CTCGACAACA TCCTCGTCGC GCACGGACGC 
AACCCGTATA GCGGCCAGCG CGACATCCAG GTCGCGATGA TGGACTGA

Protein sequence

MSEIRDSITF QNAAALKAQA RLGPGVICGL RSERAPLPLV VSPHGDSALA ADRDAALAWF 
DARRAAFDAL LLEHGGLLLR GFAVPDTHAF RALTDRYPPH AFGYIAGASP RKAIDGNVYE 
STHLPAPYKL SLHQEKAYMS HYPRLIAFYC RQAAAVGGET PLSDMRAVTR RLPARTLERF 
RGKGVMYRRN FSAKPMPAHF NQFYRRWQDA FMTDERAEVE SLCRATQLEY EWLPDGSLTV 
THVGPATVVH PRTGDEVWFN HASTQHINAR VVHPTILRAL QSFYKTRAAL PYDIRYGDGT 
PMPAEDLDPV YDAIDAEETA FRWREQDVLL LDNILVAHGR NPYSGQRDIQ VAMMD