Gene BURPS668_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2039
Symbol
ID	4881960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	2031957
End bp	2033045
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	67%
IMG OID	640127967
Product	PHB depolymerase family esterase
Protein accession	YP_001059074
Protein GI	126441643
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3509] Poly(3-hydroxybutyrate) depolymerase
TIGRFAM ID	[TIGR01840] esterase, PHB depolymerase family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.249198
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAGAA AAAAGTCCAG CATCTGGCTA CCGTACTTCG ACCTGCTCTC CCTGACGCTG 
CGCGCGCGCC CTCGGCAAAA GGTCGCCCAA CCCAAGCCGT CCGTCACGCG CCCCACAAGC 
GCCGCGAAGA CTCGGAGCAC GAAACGCACG CGCGCCGCGC ATGCCGGGCG AACGTCGGCG 
GACAACGCGC GCGGCACCTG GCTGCGCTCG TTTCACTCCG CCCGCCCCGC GGCGGGACGC 
TTGATCAATC ATCTCGCGTA TGCGCTGTAT CTGCCCGCCG CACCGGCCGC GGCGGCAAGC 
ATGCCCGCCG TCGTCATGTT GCATGGATGC AAACAGACCG CGGAGTCGTT CGCCACCGGC 
ACGCGCATTT GCGATCTCGC GCAGCGGGCG GGGTTTGCCG TGTTGCTTCC CGAGCAGGCC 
AAGACTTCGC ATTCTCACCG GTGCTGGAAC TGGCACGGCG ATTCATCGCA GTCCGAAGCG 
CCGGCCGTCG CCTCGCTCGT CGACGCGATC GTTCGGCAGT ACGGTTTCGA CCGCGAGCGA 
ATCTATCTGG CGGGCCTCTC CGCGGGAGCC GGCCTGGCGG CGGGACTCGC GATGCGCTAT 
CCCGAGCTCT TCGCGGCCGT CGGCCTGCAC TCCGGCCCGG TCTTCGGCGC GCCCTCGTCC 
ACCCTCGCGG CGATGAGCCT GATGCGCGGC GGCAGCCGGG AAGATCCGCT ACGCGTCATC 
GAAAACTGCG TCGACGTTTC GGATCATCCC GGCATGCCCG CACTCATCGT CCACGGTGAA 
CACGATACGG TGGTGGCGAA GCAGAACGCG ATGCAACTGG GTCTCGAGTT CGCGCGAATC 
AATCGGCTCA TCGACGGGCA GGGCACACTG CGCGTGGGCG AGCAACACGT CTACAGCCGC 
AAGGGCGTCG ACTATACCGA CTATCTCAAG TCCGGGCGGC TCGTCGTCAG GGTGTGCATC 
GTTCACGGGC TGCGGCACGC ATGGAGTGGC GGCGATCCGC GCGAAGCATT CCATTCCGCC 
ACCGGGCCGG ATGCCACCGC GATGTTCTGG CATTTCTTTC GGCCGCGGCG TCGCAAGCGG 
GCACAGTGA

Protein sequence

MRRKKSSIWL PYFDLLSLTL RARPRQKVAQ PKPSVTRPTS AAKTRSTKRT RAAHAGRTSA 
DNARGTWLRS FHSARPAAGR LINHLAYALY LPAAPAAAAS MPAVVMLHGC KQTAESFATG 
TRICDLAQRA GFAVLLPEQA KTSHSHRCWN WHGDSSQSEA PAVASLVDAI VRQYGFDRER 
IYLAGLSAGA GLAAGLAMRY PELFAAVGLH SGPVFGAPSS TLAAMSLMRG GSREDPLRVI 
ENCVDVSDHP GMPALIVHGE HDTVVAKQNA MQLGLEFARI NRLIDGQGTL RVGEQHVYSR 
KGVDYTDYLK SGRLVVRVCI VHGLRHAWSG GDPREAFHSA TGPDATAMFW HFFRPRRRKR 
AQ