Gene Rmet_4375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_4375
Symbol	fahA
ID	4041233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	973929
End bp	975191
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	64%
IMG OID	637979796
Product	fumarylacetoacetase
Protein accession	YP_586509
Protein GI	94313300
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00028234
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.510471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCC CCAAGACTAG CTGGGTCAAT TCCGCGAACG ACGGCCAGAC CCATTTCCCG 
CTGCAGAACC TGCCGTATGG CATCTTTTCG ACCACGGGCG GCGCGGCACG CGTGGGCGTG 
GCGATCGGCA ACCAGATCGT CGATCTGGCT GCGCTGGACG ATGCCGGCCT GATGCCGACG 
GCGGCCAAGG GCGCGTTTGC AGCGTCGAGC CTCAACCGCT TTATCGCGCT GGGCAAGCCG 
GTCTGGACCG ACGTGCGCGC GCGCCTGACC GCGCTGCTGT CCGCCGATGA CCAGCGGCTC 
TCCGGCAACG TGGCGCTGCG CGACAAGGCA CTCGTGCCGA TGTCGGCCGC CACGCTGCAT 
TTGCCGGTGG ATATTCCCGG CTATACGGAC TTCTATTCGT CGCGCGAACA CGCCACCAAC 
GTTGGCCGCA TGTTCCGCGA TCCCGAAAAC GCGCTGCTGC CAAACTGGCT CGAAATCCCG 
ATCGGCTATA ACGGCCGTGC GAGTTCGGTG GTCGTCAGCG GCACCGCGCT GCATCGTCCC 
AATGGCCAGA TCAAGCTGCC GAACGAGGCA CGCCCGATCT TCAGCCCCTG CCGCAAGCTT 
GATTACGAGC TCGAGATGGC CTTTATCGTC GGCAAGCCGT CGAACCTCGG CGAGCCGGTG 
AGCACAGGCG ATGCCCCGGC CCATATGTTC GGTCTGGTGA TCCTCAACGA TTGGAGCGCC 
CGCGATATCC AGCAGTGGGA GTACGTGCCG CTCGGTCCGT TCAACAGCAA GTCCTTCGGC 
ACCTCAATTT CGCCGTGGGT GGTGACGATG GACGCGCTGG AGCCGTTCCG CCGCGAAAAC 
CCGGCGCAAT CGCCGGAGCC GTTGCCGTAT CTGCAGCAGC AAGGGCAAAA CGCCTACGAC 
ATCGACCTGG AAGTGGCGCT GCAACCAGCC GGCGCCACGG CGGCCAGCAC GGTGTGCCGC 
ACCAACTTCA AGGCGATGTA CTGGACCATG GCGCAGCAAC TGGCCCACCA CACGGTATCG 
GGCTGCAATG TGCGCATTGG CGACCTGATG GGCTCCGGCA CGATCAGCGG CACTACGTCG 
GATTCGTGCG GCAGCCTGCT GGAAACCACG CGTAATGGTG CGGAACCCGT CACCTTGGCT 
GATGGCGCGA AGCGCGGTTT CCTCGAGGAT GGCGATACCG TGACCATGAC GGGCTGGTGT 
CAGGGCGAAG GGTATCGCGT CGGCTTCGGC GAGGTAACAG GTAAAATCCT GCCGGCGCGC 
TAA

Protein sequence

MTAPKTSWVN SANDGQTHFP LQNLPYGIFS TTGGAARVGV AIGNQIVDLA ALDDAGLMPT 
AAKGAFAASS LNRFIALGKP VWTDVRARLT ALLSADDQRL SGNVALRDKA LVPMSAATLH 
LPVDIPGYTD FYSSREHATN VGRMFRDPEN ALLPNWLEIP IGYNGRASSV VVSGTALHRP 
NGQIKLPNEA RPIFSPCRKL DYELEMAFIV GKPSNLGEPV STGDAPAHMF GLVILNDWSA 
RDIQQWEYVP LGPFNSKSFG TSISPWVVTM DALEPFRREN PAQSPEPLPY LQQQGQNAYD 
IDLEVALQPA GATAASTVCR TNFKAMYWTM AQQLAHHTVS GCNVRIGDLM GSGTISGTTS 
DSCGSLLETT RNGAEPVTLA DGAKRGFLED GDTVTMTGWC QGEGYRVGFG EVTGKILPAR