Gene Caci_4345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4345
Symbol
ID	8335699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4933747
End bp	4934994
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	73%
IMG OID	644957448
Product	putative RNA polymerase, sigma-24 subunit, ECF subfamily
Protein accession	YP_003115050
Protein GI	256393486
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.756748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTTCCG ACCAACGCCT GGAGGATCTG CTCGCCGAGC TCAGGCCCGC GGTCCTCGGC 
GCCCTGGTCC GACGGCACGG GCAGTTCGAC GGCTGCGAGG ATGCGGTGCA GGAGGCGCTC 
GTCGCCGCGG CCACGCAGTG GCCAGCCGAG GGCGTTCCGG ACAACCCGCG CGCCTGGCTG 
CTCACCGTCG CGGGGCGCCG CCTCACCGAC TATTGGCGCA GCGACCACGC GCGCCGCACG 
CGCGAGGCCA CGGTCGCGGC CATGGCGGCG CCGGAATCCG CGTACGCTCC GGCGCCGGAC 
GACGAGGAGC GGATCTCAGC CGACGACGAC ACCCTGATGC TGCTGTTCCT GTGCTGCCAT 
CCGGTGCTCA GCCCGTCCTC GCAGGTGGCG CTGACGCTGC GGGCGGTCGG CGGACTTACC 
ACCGAGGAGA TCGCGCAGGC GTTCCTGGTC CCGCAGACCT CGATGACGCG CCGCATCTCC 
CGCGCCAAGC AGCAGGTCAA GGACGCAGGG CTGACGTTCC GCCTGCCGCC GCAGGCCGAG 
CGTGCCGAGC GGACGCGCGC GGTCCTGCAC GTGCTGTACC TCATCTTCAA TGAGGGCTAC 
ACCGCCACCG CCGGTCCGGA TCTGCTGCGT CCGGACCTCA CCGCCGAGGC GATCCGCCTG 
ACCCGGCAGG TCCACCGCGT CCTGCCGGAG AACGGCGAGG TCGAGGGTCT GCTGGCGCTG 
ATGCTCCTGA CCGAGGCGCG CAGCCCGGCG CGGACGCTGG CCGACGGGAC TCTGGTCCCG 
ATGGCCGATC AGGACCGGTC GCTGTGGAAC GGCGATCTGG CCGAGGAGGG GTTGGCGTTG 
GTGGTCGAGG CGCTGGCTCG GCCGGGCGTC GGTCCCTACC GCTTGCAGGC TGCGATCGCT 
GCGGTGCACG TGGAGACGCC CGCCGACGGC ACGACGGACT GGCCGCAGAT CCTGGCGCTG 
TACGACCTGC TGGAGCAGAT GGCGCCGAAC GCGGTGGTCC GCCTGAACCG GGCGGTGGCG 
ATGGCGATGG TCGAGGGGGC GCGCGAGGGA CTGCGGCTGC TGGAGCCGCT GGAACAGGAC 
CGATGGATGG CGGGCAACCA TCGGCTGAGC GCGGTGCGTG CCTACCTGCT GGAGATGGAC 
GGCGATCGCG CCGGCGCGCG CGAGGCGTAC CGGACGGCGG CGCGACAGGC GGCGAGCGGG 
CCGGAGCAGC GGTATCTACG GGAGCAGGCG GAGCGGTTGG GCGCCTGA

Protein sequence

MRSDQRLEDL LAELRPAVLG ALVRRHGQFD GCEDAVQEAL VAAATQWPAE GVPDNPRAWL 
LTVAGRRLTD YWRSDHARRT REATVAAMAA PESAYAPAPD DEERISADDD TLMLLFLCCH 
PVLSPSSQVA LTLRAVGGLT TEEIAQAFLV PQTSMTRRIS RAKQQVKDAG LTFRLPPQAE 
RAERTRAVLH VLYLIFNEGY TATAGPDLLR PDLTAEAIRL TRQVHRVLPE NGEVEGLLAL 
MLLTEARSPA RTLADGTLVP MADQDRSLWN GDLAEEGLAL VVEALARPGV GPYRLQAAIA 
AVHVETPADG TTDWPQILAL YDLLEQMAPN AVVRLNRAVA MAMVEGAREG LRLLEPLEQD 
RWMAGNHRLS AVRAYLLEMD GDRAGAREAY RTAARQAASG PEQRYLREQA ERLGA