Gene Bphy_4539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphy_4539
Symbol
ID	6246058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phymatum STM815
Kingdom	Bacteria
Replicon accession	NC_010623
Strand	+
Start bp	1597725
End bp	1598744
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	642596290
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001860697
Protein GI	186473355
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.409121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAAGA AACTCTATAT CTCCGATGTG ACGCTGCGCG ACGGCATGCA CGCGATTCGT 
CATCAGTATT CGATTCAGAA CGTGCAGGAC ATCGCCCGCG CGCTGGACGA AGCGAAGGTC 
GACAGCATCG AGGTCGCGCA TGGCGACGGC CTGCAGGGCT CGAGCTTCAA CTATGGCTTC 
GGCGCGCACA GCGATCTCGA ATGGATCGAG GCAGTCGCCG ATGTGGTGAG GCACGCGAAG 
ATCGCGACGC TGCTTCTGCC CGGCATCGGC ACGATTCACG ATCTGAAAGC CGCGTACGAT 
GCGGGCGCGC GTGTCGTGCG TGTCGCGACG CATTGCACGG AAGCGGATAT TTCGAAGCAG 
CACATCGAAT ATGCCCGCAG CCTCGGCATG GACACCGTCG GCTTTCTGAT GATGAGCCAC 
ATGACGACGC CCGAGAACCT TGCCGTCGAA GCGAAGAAGA TGGAAAGCTA TGGCGCGACC 
TGTGTGTACG TGGTCGATTC CGGCGGTGCG ATGAACATGA ACGACATCCG CGCGCGCTTC 
ATGGCGCTCA AGGCGACGCT CGATCCCGCG ACTCAGACGG GCATGCACGC GCATCACAAC 
CTGAGCCTCG GCGTTGCCAA CTCGATCGTC GCGGTCGAGG AGGGCTGCGA TCGCGTCGAT 
GCGAGTCTCG CGGGCATGGG CGCGGGCGCG GGCAATGCGC CGCTCGAAGT GTTCATTGCG 
GCGGTCGAGC GCATGGGCTG GCACCACGGC ACCGATCTGT ATCGCCTGCT CGATGCGGCG 
GACGATATCG TGCGCCCGCT GCAGGACCGG CCGGTGCGCG TGGACCGCGA GACGCTCGCG 
CTCGGTTATG CGGGCGTCTA TTCGAGCTTC CTGCGGCATT CGGAAATCGC AGCGAACAAG 
TACGGCCTGA AAGCCGTCGA CATTCTCGTC GAGCTGGGCA AGCGGCGCAT GGTGGGCGGT 
CAGGAAGACA TGATCGTCGA CGTCGCGCTC GATCTGAAAA AGCGCGAAGC GCACGCCTGA

Protein sequence

MDKKLYISDV TLRDGMHAIR HQYSIQNVQD IARALDEAKV DSIEVAHGDG LQGSSFNYGF 
GAHSDLEWIE AVADVVRHAK IATLLLPGIG TIHDLKAAYD AGARVVRVAT HCTEADISKQ 
HIEYARSLGM DTVGFLMMSH MTTPENLAVE AKKMESYGAT CVYVVDSGGA MNMNDIRARF 
MALKATLDPA TQTGMHAHHN LSLGVANSIV AVEEGCDRVD ASLAGMGAGA GNAPLEVFIA 
AVERMGWHHG TDLYRLLDAA DDIVRPLQDR PVRVDRETLA LGYAGVYSSF LRHSEIAANK 
YGLKAVDILV ELGKRRMVGG QEDMIVDVAL DLKKREAHA