Gene Rmet_5212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5212
Symbol
ID	4042073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	+
Start bp	1905771
End bp	1906772
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	63%
IMG OID	637980630
Product	aminocarboxymuconate-semialdehyde decarboxylase
Protein accession	YP_587340
Protein GI	94314131
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.473622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.325543
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAA TCGATATGCA TGCCCACTTC TTTCCGCGCA TCACGCGGGA AGAAGCCGCC 
GCGCTGGACG CGGACAACGC GCCATGGCTC GCCGTCGACA GCGATGGCGA ATCGGGCCAC 
ATCATGGCCG GCGACAGACG TTTCCGGCCC GTCTATCGCG CGCTATGGGA CCCCGCGCTG 
CGCATCGAGG AAATGGACCG CAACGGACTG GACATGCAGA TCGTCTGCGC CACGCCGATC 
ATGTTCGGTT ATGGATACGA CGCCAGCGCC GCAGCCACGT GGGCGCGCCG GATGAACGAC 
CTCGCGCTCG AGCATTGCGC CTATCGCCCG CAGCGCCTGA AGGCGCTGGC ACAGGTGCCG 
CTGCAGGACC TGGACCTGGC GTGCATCGAA GCCTCACGCG CCAGGGAGTC CGGCCACGTT 
GGCGTGCAAA TCGGCAATCA CCTGGGTCCG CACGACCTGG ATGACGAGCG CCTGGTCAGG 
TTCCTGGTGC ATTGCGCGAA CAACGATATT CCGGTGCTGG TGCATCCATG GGACATGATG 
ACCGACGGGC GCATGAAAAA ATGGATGCTG CCGTGGCTGG TATCGATGCC GGCGGAAACG 
CAACTCGGCA TCCTCTCGTT GATCCTGTCC GGCGCGTTTG AGCGGATTCC GGAAACGCTG 
AAGCTCTGCT TCGCCCACGG CGGTGGTGGT TTTGCCTTCC TGCTGGGTCG CGCGGAGAAC 
GCCTGGCATT GCCGGGACAT CGTGCGGCAG GACTGTCCCC AGCCGCCCTC CCACTATCTG 
AAGCGGTTCT CCGTGGACAG CGCGGTATTC GACGATCGTT CGCTACGTCT GCTGGTGGAA 
GTCATGGGTG CCGACCACGT GATGCTGGGC TCGGACTACC CGTTTCCGCT CGGTGAACAG 
GAAATCGGCA AGCTGGTCGC CAACAGCCCC AACCTCGATG AAACGGACCG GGCGCGGATT 
CTGGCAGGCA ATGCCATGCG CTTCTTCGGT CTGACAGGCT GA

Protein sequence

MKKIDMHAHF FPRITREEAA ALDADNAPWL AVDSDGESGH IMAGDRRFRP VYRALWDPAL 
RIEEMDRNGL DMQIVCATPI MFGYGYDASA AATWARRMND LALEHCAYRP QRLKALAQVP 
LQDLDLACIE ASRARESGHV GVQIGNHLGP HDLDDERLVR FLVHCANNDI PVLVHPWDMM 
TDGRMKKWML PWLVSMPAET QLGILSLILS GAFERIPETL KLCFAHGGGG FAFLLGRAEN 
AWHCRDIVRQ DCPQPPSHYL KRFSVDSAVF DDRSLRLLVE VMGADHVMLG SDYPFPLGEQ 
EIGKLVANSP NLDETDRARI LAGNAMRFFG LTG