Gene Rmet_5199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5199
Symbol
ID	4042060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	1894502
End bp	1895440
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	65%
IMG OID	637980617
Product	fumarylacetoacetate hydrolase
Protein accession	YP_587327
Protein GI	94314118
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00147171
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0797568
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAATT GGTATAGCCT CGCCACTTTT GAACTTGCCG GTCGGCAGCA GCCCGGCCTG 
GTCGTTGAGA ACACGCTCTA TGCGCTGGCC GATGTGGGCC AGGCGTGCGG CATCGAGGCA 
TCGCGCCTGC CGCAGGACCT GAATGCGGCA CTGGCGGACT GGTCGCGCCA TGCGCCGCTG 
CTGGCCGACG CCGCCGCACG TATTCCCGCA TTGCGCGCGG CTGGCAAGCT CGCCGCGGTG 
GACGCCGCCG CCACCTATGC GGCGCCCTAT CGGCCACGCC GGATCTTTGG CACCGCCTCA 
AACTTCTACG AGCACGCGGA CGAGATGGGC ACCAAGCTGG CTGCCCGCAG CGAAAGCCAG 
CCCTACATAT TCATGAAGGC TGAAACCAGC GTGGTGGCCA CCGGCACCAC GGTGCTGATG 
CCGCCGGAAA CCAAGAAACT CGACTGGGAA GTGGAGCTGG GCGTAGTGAT TGGCCAGGCA 
TGCCGCCATG TCAGCGTGGA GGACGCGCTG TCGGTGATCG CCGGCTATAC CGTGTTCAAC 
GACATCAGCG CGCGTGACCT GAACCGCCGC ACCGACTATC CGTTCACGCA CGACTGGTTC 
CGCGGCAAGA GCTTCGATAC CTTCGGCCCG ATGGGCCCGT GGCTTGTGCC CGCGACCTGC 
ATTCCCAATC CGCAGAACCT GCGCATGACG CTGCATGTCA ACGGCGAGGT CATGCAGAAC 
GGCAACACCT CGCAAATGAT CTTCTCGGTG GCCGAGCAGA TCGCCTACCT GTCGCGTATT 
CTGACGCTGC AACCTGGCGA CCTTATCGCC ACGGGCACGC CGGACGGTGT GGGCATGGGG 
CGTGGACTCT TCCTGAAGCC TGGCGACAGC ATGACGGCCT GGGTCGAGCA GATCGGCACG 
ATCGAGAACC GCGTCGCGCT GGAACCGAAC GCACGCTAG

Protein sequence

MVNWYSLATF ELAGRQQPGL VVENTLYALA DVGQACGIEA SRLPQDLNAA LADWSRHAPL 
LADAAARIPA LRAAGKLAAV DAAATYAAPY RPRRIFGTAS NFYEHADEMG TKLAARSESQ 
PYIFMKAETS VVATGTTVLM PPETKKLDWE VELGVVIGQA CRHVSVEDAL SVIAGYTVFN 
DISARDLNRR TDYPFTHDWF RGKSFDTFGP MGPWLVPATC IPNPQNLRMT LHVNGEVMQN 
GNTSQMIFSV AEQIAYLSRI LTLQPGDLIA TGTPDGVGMG RGLFLKPGDS MTAWVEQIGT 
IENRVALEPN AR