Gene BMA10247_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10247_1920
Symbol	fahA
ID	4892723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10247
Kingdom	Bacteria
Replicon accession	NC_009080
Strand	-
Start bp	1900804
End bp	1902111
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	70%
IMG OID	640150575
Product	fumarylacetoacetase
Protein accession	YP_001081457
Protein GI	126451307
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.882274
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCTA TTCCCGACAC GCTGCGCGCG AGCCTCGATC CGTCCCGCAA GAGCTGGCTC 
GATACGGCGA ACGCGGCCGC GTGCGACTTC CCGATCCAGA ACCTGCCGTT CGGCATCTTC 
AGCGACGCGC GCGACGCGTC GCGCCGCGCG GGCGTCGCCC TTGGCGATCA GATCATCGAT 
CTCGCCGCGC TCGCGCGCGC GGGGCTGCTG ACGGTCGACG GCGGGGCGGC CGTGTTCGCG 
CGGCCGGCGC TCAACGATTT CATCTCGCTC GGCCGCGACG CATGGCGCAG CGTGCGCGCC 
CAGCTGAGCG CGCTTTTCGA GCGCGGCGAC GCGCGGCTGC GCGACGACGC GGCGTTGCGC 
GCGAAGGTGC TCGTCGCGCA GCGCGACGCG GCGCTTCATC TGCCCGTCGA CATTCCCGGC 
TATACCGATT TCTATTCGTC GAAGGAGCAC GCGACGAACG TCGGCTCGAT GTTTCGCGAT 
CCGAAGAACG CGCTGCTGCC GAACTGGTCG GAGATGCCGA TCGGCTACAA CGGCCGCGCG 
TCGTCGGTCG TCGTGAGCGG CACGCCGGTG CGCCGGCCGA ACGGCCAGCT GAAGCTGCCC 
GACAGCGAGC GCCCGGTGTT CGGCGCGTGC CGCAAGCTCG ACATCGAGCT CGAGACGGGC 
TTCATCGTCG GCCGCGGCAA CGCGCTCGGC GAGCCGATCG CGTGCGAGGA TGCGGAGTCG 
CACATCTTCG GGATGGTGCT GCTCAACGAC TGGAGCGCGC GCGACATCCA GCAATGGGAA 
TACGTGCCGC TCGGGCCGTT CAACGCGAAG ACGTTCGCGA CGTCGATCTC GCCGTGGATC 
GTCACGCTCG ATGCGCTCGA GCCGTTTCGC ACCGCGCAGC CGAGGCAGGA GCCGGAGCCG 
CTCGCGTATC TGCGCCACGG CGGCGCGCAT GCGTTCGACA TCGAGCTCGA AGTGCGGCTG 
AGGCCGGAGG GCGCCGCCGA CGCGACGACG ATCGCGCGCA CGAACTTCAG GCACATGTAC 
TGGACGATGG CGCAGCAGCT CGCGCACCAC ACGGTGTCGG GCTGCAACAC GCGGGTCGGC 
GACCTGATGG GCTCGGGCAC GATCAGCGGG CCGGCGAAGC AGGCGTTCGG CAGCCTGCTC 
GAGCTGACGT GGAACGGCAA GGAGCCCGTC TCGCTCGCGG GCGGCGGCAC GCGCGCGTTC 
ATCGAGGACG GCGACGAGCT GACGCTGGCG GGCTGGTGCC AGGGCGACGG GTATCGCGTC 
GGCTTCGGCA CGTGCGTCGG GGAGATTCTG CCGGCGCGGG GCCGGTGA

Protein sequence

MSAIPDTLRA SLDPSRKSWL DTANAAACDF PIQNLPFGIF SDARDASRRA GVALGDQIID 
LAALARAGLL TVDGGAAVFA RPALNDFISL GRDAWRSVRA QLSALFERGD ARLRDDAALR 
AKVLVAQRDA ALHLPVDIPG YTDFYSSKEH ATNVGSMFRD PKNALLPNWS EMPIGYNGRA 
SSVVVSGTPV RRPNGQLKLP DSERPVFGAC RKLDIELETG FIVGRGNALG EPIACEDAES 
HIFGMVLLND WSARDIQQWE YVPLGPFNAK TFATSISPWI VTLDALEPFR TAQPRQEPEP 
LAYLRHGGAH AFDIELEVRL RPEGAADATT IARTNFRHMY WTMAQQLAHH TVSGCNTRVG 
DLMGSGTISG PAKQAFGSLL ELTWNGKEPV SLAGGGTRAF IEDGDELTLA GWCQGDGYRV 
GFGTCVGEIL PARGR