Gene BURPS1106A_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3212
Symbol	fahA
ID	4900949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3129481
End bp	3130788
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	70%
IMG OID	640136438
Product	fumarylacetoacetase
Protein accession	YP_001067450
Protein GI	126454358
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCTA TTCCCGACAC GCTGCGCGCG AGCCTCGATC CGTCCCGCAA GAGCTGGCTC 
GATACGGCGA ACGCGGCCGC GTGCGACTTC CCGATCCAGA ACCTGCCGTT CGGCGTCTTC 
AGCGACGCGC GCGACGCGTC GCGCCGCGCG GGCGTCGCGC TTGGCGATCA GATCATCGAT 
CTCGCCGCGC TCGCGCGCGC GGGGCTGCTG ACGGTCGACG GCGGGGCGGC CGTGTTCGCG 
CGGCCGGCGC TCAACGATTT CATCTCGCTC GGCCGCGACG CATGGCGCAG CGTGCGCGTC 
CAGCTGAGCG CGCTTTTCGA GCGCGGCGAC GCGCGGCTGC GCGACGACGC GGCGTTGCGC 
GCGAAGGTGC TCGTCGCGCA GCGCGACGCG GCGCTTCATC TGCCCGTCGA CATTCCCGGC 
TATACCGATT TCTATTCGTC GAAGGAGCAC GCGACGAACG TCGGCTCGAT GTTTCGCGAT 
CCGAAGAACG CGCTGCTGCC GAACTGGTCG GAGATGCCGA TCGGCTACAA CGGCCGCGCG 
TCGTCGGTCG TCGTGAGCGG CACGCCGGTG CGCCGGCCGA ACGGCCAGCT GAAGCTGCCC 
GACAGCGAGC GCCCGGTGTT CGGCGCGTGC CGCAAGCTCG ACATCGAGCT CGAGACGGGC 
TTCATCGTCG GCCGCGGCAA CGCGCTCGGC GAGCCGATCG CGTGCGAGGA TGCGGAGTCG 
CACATCTTCG GGATGGTGCT GCTCAACGAC TGGAGCGCGC GCGACATCCA GCAATGGGAA 
TACGTGCCGC TCGGGCCGTT CAACGCGAAG ACGTTCGCGA CGTCGATCTC GCCGTGGATC 
GTCACGCTCG ATGCGCTCGA GCCGTTTCGC ACCGCGCAGC CGAGGCAGGA GCCAGAGCCG 
CTCGCGTATC TGCGCCACGG CGGCGCGCAT GCGTTCGACA TCGAGCTCGA AGTGCGGCTG 
AGGCCGGAGG GCGCCGCCGA CGCGACGACG ATCGCGCGCA CGAACTTCAG GCACATGTAC 
TGGACGATGG CGCAGCAGCT CGCGCACCAC ACGGTGTCGG GCTGCAACAC GCGGGTCGGC 
GACCTGATGG GCTCGGGCAC GATCAGCGGG CCGGCGAAGC AGGCGTTCGG CAGCCTGCTC 
GAGCTGACGT GGAACGGCAA GGAGCCCGTC TCGCTCGCGG GCGGCGGCAC GCGCGCGTTC 
ATCGAGGACG GCGACGAGCT GACGCTGGCG GGCTGGTGCC AGGGCGACGG GTATCGCGTC 
GGCTTCGGCA CGTGCGTCGG GGAGATTCTG CCGGCGCGGG GCCGGTGA

Protein sequence

MSAIPDTLRA SLDPSRKSWL DTANAAACDF PIQNLPFGVF SDARDASRRA GVALGDQIID 
LAALARAGLL TVDGGAAVFA RPALNDFISL GRDAWRSVRV QLSALFERGD ARLRDDAALR 
AKVLVAQRDA ALHLPVDIPG YTDFYSSKEH ATNVGSMFRD PKNALLPNWS EMPIGYNGRA 
SSVVVSGTPV RRPNGQLKLP DSERPVFGAC RKLDIELETG FIVGRGNALG EPIACEDAES 
HIFGMVLLND WSARDIQQWE YVPLGPFNAK TFATSISPWI VTLDALEPFR TAQPRQEPEP 
LAYLRHGGAH AFDIELEVRL RPEGAADATT IARTNFRHMY WTMAQQLAHH TVSGCNTRVG 
DLMGSGTISG PAKQAFGSLL ELTWNGKEPV SLAGGGTRAF IEDGDELTLA GWCQGDGYRV 
GFGTCVGEIL PARGR