Gene Rmet_1222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_1222
Symbol
ID	4038025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	1340607
End bp	1342283
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	66%
IMG OID	637976609
Product	benzoyl-CoA-dihydrodiol lyase
Protein accession	YP_583377
Protein GI	94310167
COG category	[I] Lipid transport and metabolism
COG ID	[COG1024] Enoyl-CoA hydratase/carnithine racemase
TIGRFAM ID	[TIGR03222] benzoyl-CoA-dihydrodiol lyase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.677268
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0150752
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGACA CCGCCCCCAT CGCATCCAGC GCCCCCGTCA CGTTCGAGCG CGATCCCGAG 
CAATACCGTC ACTGGCAACT TACGTTCGAG GGCCCCGTCG CCACGCTGGC GATGAACGTC 
GACGAGGAAG GCGGACTGCG CCCTGGCTAT GCGCTGAAGC TGAACTCCTA TGACCTGGGC 
GTCGACATCG AACTGCACGA TGCCCTGCAG CGCATTCGCT TCGAACATCC GGAAGTGCGC 
ACCGTCGTGA TGACGAGCAC GAAAGATCGC ATCTTCTGCT CGGGCGCCAA CATCTTCATG 
CTCGGCAAGT CCAGCCACGC CTGGAAGGTC AACTTCTGCA AGTTCACGAA CGAGACCCGC 
AACGGTATCG AGGACGCCAG CCTCCACTCG GGCATCAAGT TCATCGCCGC CTGCAACGGC 
ACCACGGCGG GCGGCGGCTA CGAGCTGGCG CTGGCCTGCG ACGAGATCGT GCTGGTCGAC 
GACCGCTCCT CGGCCGTGAG CCTGCCCGAA GTGCCGCTGC TGGGCGTGCT GCCGGGCACC 
GGCGGCCTGA CGCGCGTCAC CGACAAGCGC CATGTGCGCC GCGACCACGC CGACATCTTC 
TGCCTGACCA CCGAAGGGGT GCGCGGGCAA CGCGCCAAGG ACTGGAAGCT TGTCGACGAG 
GTGGTCAAAC CCGCACGCTT TGCCGAATAC GTGCGCGAAC GCGCGCAGGC GCTGGCCGCC 
CAGAGCGACC GCCCCGCCGA TGCACAGGGC GTGAGACTGA CGCCACTGAC GCGCACCGTG 
ACGCCCGAAG GCTATCGGTA CGAAACCGTA CGCGTCGACA TCGACCATGA GTCACGCCGC 
GCAACGATCA CCGTGTCGGC GCCCGACGTC GGTCAACCCC GGGATCTGGC CGGCATCCTC 
GCCGCCAGCG CCCAGTGGTG GCCGCTCAAG ATGGCGCGCG AGCTAGACGA CGCCATCCTG 
ACGCTGCGCA CCAATCATCT CGATATCGGC ATGTGGATCC TCAAGACCAC CGGCGATGCC 
GCACAGGTGC TGGCGGCCGA TGCGCTGATG GATGCGCACG CCAGCCACTG GTTCGTGCGC 
GAGACGATCG GCATGCTGCG CCGCACGCTG GCGCGCCTGG ATGTGTCGTC GCGCAGTCTG 
TTCGCGCTGG TGGAACCGGG CTCCTGCTTT GCCGGCACGC TGCTGGAACT GGTGCTGGCC 
GCGGACCGCG CCTACATGCT GCAACTGCCC GACACGCCGG ACGAAGCTCC TCGCGTTCAT 
GCCGACGTCG CCAACTTCGG CCGCTATCCG ATGCCGAACG GCCTGACGCG CCTGGCCGCA 
CGCTTCTATG AAGATGTCGA CGCCATCGTC GCCGTGCGCG AACAGGCCGG CAAGCCGCTA 
GACGGCCCCG CCGCCGAAGC ACTTGGCCTG ATCACGGCCG CGCTCGACGA CATCGACTGG 
GAAGACGAAA TCCGTATCGC CACCGAGGAA CGCGCGAGTC TGTCCCCCGA CGCCCTGACC 
GGTCTGGAAG CCAACCTGCG CTTCGGCGGG CGAGAAACGA TGGAAACGCG CATTTTCGGG 
CGCCTGACGG CCTGGCAGAA CTGGATCTTC AACCGGCCCA ACGCGGTCGG CGAACACGGC 
GCGCTCAAGG TATTCGGCAC CGGTAACAAG GCACGCTTCG ACTGGGATCG GGTCTGA

Protein sequence

MSDTAPIASS APVTFERDPE QYRHWQLTFE GPVATLAMNV DEEGGLRPGY ALKLNSYDLG 
VDIELHDALQ RIRFEHPEVR TVVMTSTKDR IFCSGANIFM LGKSSHAWKV NFCKFTNETR 
NGIEDASLHS GIKFIAACNG TTAGGGYELA LACDEIVLVD DRSSAVSLPE VPLLGVLPGT 
GGLTRVTDKR HVRRDHADIF CLTTEGVRGQ RAKDWKLVDE VVKPARFAEY VRERAQALAA 
QSDRPADAQG VRLTPLTRTV TPEGYRYETV RVDIDHESRR ATITVSAPDV GQPRDLAGIL 
AASAQWWPLK MARELDDAIL TLRTNHLDIG MWILKTTGDA AQVLAADALM DAHASHWFVR 
ETIGMLRRTL ARLDVSSRSL FALVEPGSCF AGTLLELVLA ADRAYMLQLP DTPDEAPRVH 
ADVANFGRYP MPNGLTRLAA RFYEDVDAIV AVREQAGKPL DGPAAEALGL ITAALDDIDW 
EDEIRIATEE RASLSPDALT GLEANLRFGG RETMETRIFG RLTAWQNWIF NRPNAVGEHG 
ALKVFGTGNK ARFDWDRV