Gene Caci_5004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5004
Symbol
ID	8336358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5728247
End bp	5729461
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID	644958103
Product	putative transcriptional regulator, PucR family
Protein accession	YP_003115705
Protein GI	256394141
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.351377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.990518
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCAG CTCACTCGCC GGAGGTCGAG GCTGAGGCCC GGGCCCTCGT GGCACGGTTC 
GCAGAACGGC TCGATGAACT GGCTGATCTC ATGGCCGCGC ACATCCTGGC CGAGTCGGCC 
GTATTGCGTT CCTTGGTCGC CGAGCACGAG CTGCGGGTCA CCTGTGCCCA GAACATCAAC 
CAGCTGCTGA CCATGCTCGG CGGGCGTCCT CCGGCCGGTT CGGCGCCGGC CGATGCCGGG 
CGCGCCGGAG TCCGCGACGG GGTGCCGATG TCGGCGCTGT TCGACGCCTA CCAGATCGGC 
GCGACCTTCC TGTGGGAGGA ACTGGCCGAA ACCGGAGCTC ACGGCGAATG GTCAGCCGCC 
GCGGTGATCC TGCTCGCGAC CAAGTCCTGG CGGCATCTGC ACGAGTTCAC CACCGCCATG 
TCCGAGAGCT ACCGCGCCGA GCTGGAGACG CGGGTCCGCA AGCAGGTCCG CAGACGGTCG 
GCGTTGGTGC AGGCACTGTT GGAGGGAAGC CTGGCCGAGC CCGAACTGTG GGAGGCCGCG 
GACCTGCTGC GGCTCCCCCA CCGCGGCCCG TACGTGGTGA TCGCCGCGCG GGTGGCCGGT 
ATCGCGGAGT CGGCACTGCC GACCATCGAG CAGACCCTCG ACGCCCTCGG CATCGGCTCA 
GCCTGGCAGC TCACCCACGA CCTGGAGGTC GGCGTGGCCA GCCTGCCGCG CCCCGGCGAC 
CAGTTCGACC GCCTGATCGA GAAGCTCGAC GCCGACGGCG CGAGCCGAGT CGGTGTCAGT 
CCCCTGTATG AGGACCTGGC CGCCACCTCG CAGGCCGTGC GCCTGGCGCG GATCGCCCTC 
CGCGGCGCCG CCAACCCGGG CCGCGTCGTG GTCTTCGGCC GCGACCCCCT GTCGGTGGCG 
GCGGCCAGCG CACCGGACGT GATGGCCCGC CTGGCCCGCA CGATCCTCGC CGGCCTCGAC 
GGCATGCCGC CCGAGGACCG CCTCATCCTG CTGGACACCT TCGGAGCATG GCTCGACGGC 
GCCGGCTCAG CCGAGGAGGC AGCACGCCGA CTCCATGTGC ACCCGAACAC CGTGCGCTAC 
CGCCTCCGCC GCCTTGAGGA ACGCACCGGC CGGGCATTGT CGGACCCGCG GCATGTGGCG 
GAGCTGAGCT TGGCCTTCGA AGTTAAGCGC GGGTGGGAGT CAGGGGCGGC AGTCGCGGAG 
TCGCACAGCG GGTAG

Protein sequence

MAAAHSPEVE AEARALVARF AERLDELADL MAAHILAESA VLRSLVAEHE LRVTCAQNIN 
QLLTMLGGRP PAGSAPADAG RAGVRDGVPM SALFDAYQIG ATFLWEELAE TGAHGEWSAA 
AVILLATKSW RHLHEFTTAM SESYRAELET RVRKQVRRRS ALVQALLEGS LAEPELWEAA 
DLLRLPHRGP YVVIAARVAG IAESALPTIE QTLDALGIGS AWQLTHDLEV GVASLPRPGD 
QFDRLIEKLD ADGASRVGVS PLYEDLAATS QAVRLARIAL RGAANPGRVV VFGRDPLSVA 
AASAPDVMAR LARTILAGLD GMPPEDRLIL LDTFGAWLDG AGSAEEAARR LHVHPNTVRY 
RLRRLEERTG RALSDPRHVA ELSLAFEVKR GWESGAAVAE SHSG