Gene BURPS668_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3893
Symbol
ID	4881991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3791232
End bp	3792218
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	66%
IMG OID	640129821
Product	3-oxoadipate enol-lactone hydrolase family protein
Protein accession	YP_001060887
Protein GI	126438367
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.28749
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTTCGA GATACGTCGG AGATAATGTA GCGCGACGAT TCCATCGCTC CGCACGAGAA 
AGCGGCAATC ATGACGATTG CCGCCGATTG CTTCGGCATG CGCATCGATT CCGCGCGTTC 
GCCCGAACTC CCTTAACCGA TTCATTGCCT AGCGACCTTA TCGACATGCC TTTCGTCACG 
ATCGATGGCC AGCCCCTGCA CTATCAGATC AGGGGCGCCG GCGCGCCCGT CCTGTTCGGA 
CACAGCTACC TGTGGGATTC GTCGATGTGG GAGCCGCAGC TCGACGCGCT CTCGAAGTCG 
TACCGCGTAA TCGCGCCGGA CCTGTGGGGA CACGGCCGGT CCGGCCCGCT GCCCGACGGC 
ACGCGCAGCC TCGACGATCT CGCGAGACAG ATGAGCGAGC TCCTCGATCA CCTCGGCATC 
GACACCTGCT CGATCGTCGG GCTATCGGTG GGCGGCATGT GGGCGGTGCC GCTCGCGCAT 
CGCGCGCCGC AACGCATCGA TCGTCTCGTG CTGATGGATA CCTACGTCGG CGTCGAGCCC 
GACGCGACGC GCAACCAGTA TTTCCAGATG CTCGAGGCCA TCGACGCGCA AGGCGCGATT 
CCGGCGCCGC TGCTCGACGC GATCGTGCCG ATCTTCTTCC GCCCCGGCAT CGATCCGGCG 
AGCGAGCTGC CCACGGGCTT CCGGCGCGCG CTGCAGGCGT TCACGACCGA GCGGCTGCGC 
GACTCGGTGA TACCGCTCGG CAAGATCACG TTCGGCCGCG AAGACGCGCG CGCGCAACTG 
AGCGCGCTGC CGGCGGACCG CACGCTCGTG ATGTGCGGCG CGAACGACGT CGCGCGGCCG 
CCCGAGGAAG CCGACGAAAT CGCGGCGCTC ATCGGCTGCG AAAAGGCGTT CGTGCCGAAT 
GCCGGACATA TCTCGAATCT CGAGAATCCG GCATTCGTCA CGCAGGCGCT GAGCGACTGG 
CTCGGGCGCG GCGCGGCCCG CGCGTGA

Protein sequence

MISRYVGDNV ARRFHRSARE SGNHDDCRRL LRHAHRFRAF ARTPLTDSLP SDLIDMPFVT 
IDGQPLHYQI RGAGAPVLFG HSYLWDSSMW EPQLDALSKS YRVIAPDLWG HGRSGPLPDG 
TRSLDDLARQ MSELLDHLGI DTCSIVGLSV GGMWAVPLAH RAPQRIDRLV LMDTYVGVEP 
DATRNQYFQM LEAIDAQGAI PAPLLDAIVP IFFRPGIDPA SELPTGFRRA LQAFTTERLR 
DSVIPLGKIT FGREDARAQL SALPADRTLV MCGANDVARP PEEADEIAAL IGCEKAFVPN 
AGHISNLENP AFVTQALSDW LGRGAARA