Gene BURPS1106A_0438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0438
Symbol
ID	4902442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	403591
End bp	404583
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	69%
IMG OID	640133668
Product	fumarylacetoacetate hydrolase family protein
Protein accession	YP_001064721
Protein GI	126454589
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.221432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTG CTTCGCTCAA GGACGGCACG CGCGACGGCC AACTGATCGT CGTCTCGCGC 
GACCTGCACA CGGCGGCGAT CGCCGACGCG ATCGCGCCGA CGCTGCAGCG CGTGCTCGAC 
GACTGGGCGT TCTACGCGCC GCAGCTGCGC GACCTGTACG ACGCACTGAA CCACGGCCGC 
GCGCGCAACG CGTTCGCGTT CGAGCCCGCC GATTGCATGG CGCCGCTGCC GCGCGCGTTC 
CAGTGGGCGG ACGGCTCCGC GTACGTGAAC CACGTCGAGC TCGTGCGCCG CGCGCGCGGC 
GCCGAGATGC CGCCCGAGTT CTGGACCGAT CCGCTGATGT ACCAGGGCGG CAGCGACGAT 
TTCCTCGGCC CGCGCGACGA CATCGTCTGC GCATCGGAGG CGTGGGGCAT CGATTTCGAG 
GCGGAAGTCG CGGTGATCAC GGCCGACGTG CCGATGGGCG CCGCGCCCGA CGAGGCGCTG 
AAAGCGGTGC GGCTCGTCAC GCTCGTGAAC GACGTGTCGC TGCGCAACCT GATTCCCGCC 
GAGCTCGCGA AGGGCTTCGG CTTCTTCCAG AGCAAGCCGG CGAGCGCGTT CGCGCCGGTG 
GCCGTGACGC CCGACGAGCT CGGCGAGCAC TGGCGCGAAG GCCGCCTGCA TCGCCCGATG 
CTCGTCCACT GGAACGGCAA GAAGGTCGGT CAGCCGGATG CGGGCGTCGA CATGGTGTTT 
CACTTCGGTC AACTGATCGC GCACGCGGCG AAGACGCGCA ACGTGCGCGC GGGCTCGATC 
GTCGGCTCGG GCACGGTGTC GAACAAGGAT GCGAAGCGCG GCTACTGCTG CATCGCCGAG 
AAGCGCTGCC TCGAGACGAT CGAGCACGGC GCGCCGCAGA CCGAGTTCAT GCGCTACGGC 
GACAGGGTGA AGATCGAGAT GGTCGACGAG GCGGGGAAGT CGATCTTCGG CGCGATCGAG 
CAGGCGGTCG CGCCGCTGGA CGCCGCCGCT TGA

Protein sequence

MKLASLKDGT RDGQLIVVSR DLHTAAIADA IAPTLQRVLD DWAFYAPQLR DLYDALNHGR 
ARNAFAFEPA DCMAPLPRAF QWADGSAYVN HVELVRRARG AEMPPEFWTD PLMYQGGSDD 
FLGPRDDIVC ASEAWGIDFE AEVAVITADV PMGAAPDEAL KAVRLVTLVN DVSLRNLIPA 
ELAKGFGFFQ SKPASAFAPV AVTPDELGEH WREGRLHRPM LVHWNGKKVG QPDAGVDMVF 
HFGQLIAHAA KTRNVRAGSI VGSGTVSNKD AKRGYCCIAE KRCLETIEHG APQTEFMRYG 
DRVKIEMVDE AGKSIFGAIE QAVAPLDAAA