Gene Caci_2008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2008
Symbol
ID	8333352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2272558
End bp	2274279
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	68%
IMG OID	644955158
Product	benzoyl-CoA-dihydrodiol lyase
Protein accession	YP_003112769
Protein GI	256391205
COG category	[I] Lipid transport and metabolism
COG ID	[COG1024] Enoyl-CoA hydratase/carnithine racemase
TIGRFAM ID	[TIGR03222] benzoyl-CoA-dihydrodiol lyase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.274826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCG GGGAGGTTGA TATCGCAACC GATATCGACA TCGACTTCGA CACCGCGCCG 
GATCAATATC GGCACTGGAC GCTGCAGATC GACGGCGCCG TGGCGACGCT CCGGCTGGCC 
GTCGCCGAGG ACGGCGGGCT GCTGCCGGGG TACGCGTTGA AGCTGAACTC CTACGACCTC 
GGCGTCGACA TCGAGCTCTA CGACGCCGTG CAGCGCCTGC GGTTCGAGCA TCCCGAGGTC 
CGCGCCGTGG TGATGACCGG CGGCTTGGAG CGGATGTTCT GCGCCGGGGC GAACATCAGG 
ATGCTGGCTC AGTCCTCGCA CGCGTGGAAG GTGAACTTCT GCAAGTTCAC CAACGAGACG 
CGGTGCGGCA TCGAGGACGC GACTGCGCAC TCCGGACAGA CGTGGATCGC CGCCGTCAAC 
GGACCGGCGG CCGGCGGCGG ATACGAGCTG GCGTTGGCGT GCGAGCACAT CGTGCTGGTC 
GACGACGGGT CCACGACCGT GTCGTTGCCG GAGGTGGCGT TGCTGGGCGT CCTGCCGGGG 
ACCGGAGGGC TGACGCGGCT GACCGACAAG CGGCACGTTC GGCGCGATCG CGCGGACGTC 
TTCGCGACCA AGACCGAAGG CTTCCGTGGG GCGACCGCAC TGGAGTGGGG ACTGGTCGAC 
GCGGTCGCTC CGCCGGCGCG GTTCTCGGCA GAGGTCGCGC GGGTCGCGGA CGACGCGGCG 
CGGCGGTCGC GCCGGGCTCG GGTGGGGATG GGTGTGGGAG TGGGAGTGGC GAGCGCGGTC 
GGACCTGAGA AGGGCGTCAT GCTGACGCCG TTGGCGCGGG TCGTGGACGA GGACTCGCTG 
ACGTATCCGT ATCTGGCAGT GGAGATCGAT CGGTCTGCGC GGCGTGCGGA CTTCACCTTG 
CTCGGTCCGA GCGACGCGCC GCCCGCCGAC GTGCACGCTC AGGGTCCTGA TTACTGGCCG 
CTGGCGCTGA CCCGCGCGCT CGACGACGCG ATCCTGCGGC TGCGGACGAA CGAGCCGGAG 
ATCGGCACGT GGGTAGTGCG GACGCGCGGA TCGATCGACG CGGTGGCGGC GTACGACGCG 
CAGCTGACCA CGCTGGCCGA CGACTGGTTC GTCAACGAGG TACGGCACTA CTACAAGCGG 
ACGCTCAAGC GCTTGGACAT GACGAGCCGG AGTCTGGTGG CGGTCATCGA TCCGGGGAGC 
TGCTTCGTCG GACTGCTGCT GGAAACGGCG CTCGCTGCGG ACCGGCAGTA CATGCTCGAT 
GGCGTGTATG AGGATGTTGA TCCAGACGCC GCGCCCGCAG CTTTGGTGGT GACGGCTTCG 
AATCTGGCGG CGTGGCCGAT GGCGAACGGT CTGAGCCGCC TGGCGACGCG CTTTTCAGGG 
CACGAAGGCG GGCTGGAAGC GGCGGCGCAT GTGGGGGAAC GGCTGAACGC CGACGCGGCG 
GTGGAGTTCG GTCTGGTCAC CTATGCGCTC GACGATCTGG ACTTCGAGGA CGAGCTCCGT 
CTGGCGCTGC AGGAGCGGGC GGCGCTGTCG CCGGATGCGT TGACCGGTAT GGAGGCGAAC 
CTGCGCTTCC CCGGACCGGA GACGATGGAG ACGAAGATCT TCGGTCGGCT GACCGCGTGG 
CAGAACTGGG TGTTCGTGCG GCCGAACGCT TCGGGTGCGG ACGGTGCGCT GTCGCGGTAC 
GGATCGGGAG TCGTGGCGGA GTTCGATCAT CGGCGGGTGT GA

Protein sequence

MTGGEVDIAT DIDIDFDTAP DQYRHWTLQI DGAVATLRLA VAEDGGLLPG YALKLNSYDL 
GVDIELYDAV QRLRFEHPEV RAVVMTGGLE RMFCAGANIR MLAQSSHAWK VNFCKFTNET 
RCGIEDATAH SGQTWIAAVN GPAAGGGYEL ALACEHIVLV DDGSTTVSLP EVALLGVLPG 
TGGLTRLTDK RHVRRDRADV FATKTEGFRG ATALEWGLVD AVAPPARFSA EVARVADDAA 
RRSRRARVGM GVGVGVASAV GPEKGVMLTP LARVVDEDSL TYPYLAVEID RSARRADFTL 
LGPSDAPPAD VHAQGPDYWP LALTRALDDA ILRLRTNEPE IGTWVVRTRG SIDAVAAYDA 
QLTTLADDWF VNEVRHYYKR TLKRLDMTSR SLVAVIDPGS CFVGLLLETA LAADRQYMLD 
GVYEDVDPDA APAALVVTAS NLAAWPMANG LSRLATRFSG HEGGLEAAAH VGERLNADAA 
VEFGLVTYAL DDLDFEDELR LALQERAALS PDALTGMEAN LRFPGPETME TKIFGRLTAW 
QNWVFVRPNA SGADGALSRY GSGVVAEFDH RRV