Gene BURPS1106A_A2454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2454
Symbol
ID	4903937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2420445
End bp	2421488
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	67%
IMG OID	640145558
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001076485
Protein GI	126457348
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACTGA TCAGCGATGC GACCTTGCGC GACGGCAACC ATGCGATTCG TCACCAACTG 
AGCGCCGCGC AGATACATGC GTATGCGCGC GCGGCCGACG AAGCCGGCAT CGATGTCGTC 
GAAGTCGGCC ACGGCAATGG TCTCGGAGGC TCGTCTTGCC TGCTCGGGCA GACGCCGATC 
GGCGATCGCC TGATGCTCGA GACCGCGCGC GCCGCGCTGC GCACGAGCCG GCTCGGCGTG 
CATTTCATTC CGGGGCTCGG CAAGGCGGCG GACATCTCGC TTGCGCTCGA GATCGGCGTC 
GATGTCGTGC GCGTCGCGAC GCATTGCACC GAGGCGAACG TGTCGGCGCG CTTCATCGAG 
CAGACCCGGA CGGCCGGACG CACGGCGTTC GGCGTGCTGA TGATGTCGCA CATGGCGCCG 
CCCGATACGC TGCTCGCGCA GGCGAAGCTG ATGGAGCGCT ACGGCGCGCA GGCAGTGGTG 
CTGATGGACA GCGCCGGGTA TTCGACGCCG TCGCTCGTGC GCGCGAAGGT CGAGCGCCTC 
GTCGACGGTC TCGACATCGA CGTCGGCTTT CACGCGCACA ACAACCTCGG GCTCGCGGTC 
GCGAACAGCC TCGTCGCGCT CGAAGCGGGG GCGCGCATCG TCGACGCATG CGTGAAAGGC 
TTCGGGGCCG GCGCGGGCAA TACGCAGCTC GAAACGCTCG TCGCCGCGAT GGAGCGCGAA 
GGGCACGACA CGCGCACGAC GTTCGAGCGC GTGATGACGC TCGCGCGCGG CACGGAGACG 
TTTCTCAATC CGAAGACGCC GCACATCCAG CCGGCGAACA TCGCGAGCGG GCTGTACGGC 
CTTTTCTCCG GCTACGTGCC GCATATCCAG AAAGCCGCGC AGGAATTCGG CGTCAACGAA 
TTCGAGCTGT ACAAGCGGCT TGCGGAGCGC AAGCTCGTCG CCGGGCAGGA GGACATCATC 
ATCGAAGAGG CAAGCCGTCT CGCGCGCGAA CGGGATGTGC AGCGCGCAAC GGGCGGCGTG 
CGCGTTCGCG AGCTGTCCGC GTGA

Protein sequence

MILISDATLR DGNHAIRHQL SAAQIHAYAR AADEAGIDVV EVGHGNGLGG SSCLLGQTPI 
GDRLMLETAR AALRTSRLGV HFIPGLGKAA DISLALEIGV DVVRVATHCT EANVSARFIE 
QTRTAGRTAF GVLMMSHMAP PDTLLAQAKL MERYGAQAVV LMDSAGYSTP SLVRAKVERL 
VDGLDIDVGF HAHNNLGLAV ANSLVALEAG ARIVDACVKG FGAGAGNTQL ETLVAAMERE 
GHDTRTTFER VMTLARGTET FLNPKTPHIQ PANIASGLYG LFSGYVPHIQ KAAQEFGVNE 
FELYKRLAER KLVAGQEDII IEEASRLARE RDVQRATGGV RVRELSA