Gene Rmet_5544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_5544
Symbol
ID	4042405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	2290151
End bp	2291611
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	56%
IMG OID	637980962
Product	aldehyde dehydrogenase
Protein accession	YP_587672
Protein GI	94314463
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACC TAACTGCGGA CGCAATTTCT GAAGCCTTGC GAGGCAATCC GGTCCGGCAA 
CTGATTAACG GTTCGATGGT TGATGGGGCC GAAACGCTTG AAGTCATTAA CCCAGCTACC 
GGCGAGGCTT GCGCCATTGC GCCCGTGGCT TCTTTGCGAC AGCTTGACGA AGCTGTCGAC 
GCTGCCCGGC GTTCGCAACA AAGCTGGGGT GGCTTGCCAT TGACAGAGCG CAGAACGGCT 
CTAAAGGGGT TAGCCACGAT TCTTCGGGAG CATGTTGCGG AGTTGGCTGC GCTGCTGACG 
CTAGAGCAAG GCCGACCTCT CGCCCAGACT GAAGCGGAAG TGATGCGTGC CGCCATGCTG 
CTCGAGGCCA TGCTCACGAT TGACATCGAC GACGAGATTC TTCGCGAAGA TGAATCTGGT 
CGGGTCATTC TGCAACACAA GCCGATTGGC GTTGTCGGTG CCATTGCCCC TTGGAACGTT 
CCCATCGGAC TCGCCGTTCC GAAGATCACC CATGCACTCT ACGCTGGCAA TACTGTTGTA 
CTAAAGCCGT CCCAATACAC TCCTCTGGCC ACGCTGCGAC TTGGTGAGTA CGCATCGAAC 
CTGTTCCCCC CTGGAGTGCT GAACGTCTTG AACGGTGGAA ATGATCTTGG GGAAAGGATT 
TGCACGCACC CGGACATCGC CAAGATCTCC CTGACTGGAT CTGTGCCAAC AGGGAAACGA 
GTTATGGCGT CCGCTGCAGC CTCGCTGAAG CGCTTAACGC TTGAGCTAGG TGGAAACGAC 
GCCTGCATCG TCCGCCAGGA TGCGGACGTT GACAAGATTG CACCCGCGCT GTTCGCTGCG 
GCGTTCATCA ACAGTGGTCA GGTTTGCATG GCGATAAAGC GCCTTTTCGT ACATCAGGAT 
CTTCATGAGC GCCTGGTTGA AAAGCTGGGA GGCCTAGCTG CTAAAGCCAA AGTAGGCGAT 
GGCTTTGACT CGACGAGCCA AATGGGGCCG GTTCAGAATC GTGCGCAATA CGAGTCGGTA 
AAAGCAGTTC TGGCCGAAGT GGCCGCAGAC CCGGCAGCAA TCATTGTCGC GGGTGGCGAA 
GCGTTGAGCC GCCAGGGATT CTTCATTGCT CCCACAGTCG TATCGGGCGT CAGAGAAGGA 
AATTCCCTTG TCGACAAGGA GACGTTTGGG CCAGTGCTTC CAGTCCTATC TTTTCAAACC 
GATGAGGAAG CGATCGAGCG TGCGAATGCC GGATCGATGG GATTGGGTGC GTCTGTGTGG 
GGCAATGATC TCAAAATGGC AGAGCACGTA GCGCGGCAGT TGGTAGCTGG CACCGTATGG 
ATAAACAGAC ATGTGGGCGT TGACCCCTTG GTGCCGTTTG GCGGAGCAAA GGAATCCGGT 
CTTGGACGGC AGTTCGGAAA AGCAGGGTTG CTAGAGTTCA CCGAAACATC CGCGCTGTTT 
GTTCCCAGAG CCAACAAATA G

Protein sequence

MKYLTADAIS EALRGNPVRQ LINGSMVDGA ETLEVINPAT GEACAIAPVA SLRQLDEAVD 
AARRSQQSWG GLPLTERRTA LKGLATILRE HVAELAALLT LEQGRPLAQT EAEVMRAAML 
LEAMLTIDID DEILREDESG RVILQHKPIG VVGAIAPWNV PIGLAVPKIT HALYAGNTVV 
LKPSQYTPLA TLRLGEYASN LFPPGVLNVL NGGNDLGERI CTHPDIAKIS LTGSVPTGKR 
VMASAAASLK RLTLELGGND ACIVRQDADV DKIAPALFAA AFINSGQVCM AIKRLFVHQD 
LHERLVEKLG GLAAKAKVGD GFDSTSQMGP VQNRAQYESV KAVLAEVAAD PAAIIVAGGE 
ALSRQGFFIA PTVVSGVREG NSLVDKETFG PVLPVLSFQT DEEAIERANA GSMGLGASVW 
GNDLKMAEHV ARQLVAGTVW INRHVGVDPL VPFGGAKESG LGRQFGKAGL LEFTETSALF 
VPRANK