Gene Caci_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1761
Symbol
ID	8333104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1991902
End bp	1993581
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	70%
IMG OID	644954911
Product	RNA polymerase sigma factor
Protein accession	YP_003112523
Protein GI	256390959
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGCCA GCACTTCCCG TCCACTGCCC GCCGAGATCG CCGAGTCCGC CCACCTCGTG 
GCGCTCATCG AGCGGGGCAG GGCGCAGGGA CACATTGCCG CAGACGAGGT GCGGCAGGCC 
TTTGAAGAGG CGGACATCCC GATGGCCAAG GCCAAGAGCG TCATGCGGGC CCTGACCACC 
GTACTCCACG AGGACGGCGT CGATCTGACG GTCAACGCCG TGCAGAGCGC CGGGGTCGCG 
CGCAAGCGCG TCGCCGCGGC GAGCAAGACC GCGGCCAAGA AGACGACCAC GGCCACCGCG 
GCCAAGGCCG CGACGGTCAA GAAGGCCGCC GCCAAGACCG CCGCGCCGGC TGTCGCGGCC 
GCCAACGGCG CGTCCGAGGA AGGCGCCGAG GCCGGTTCGG CCGCGGCGAA GAAGACCGCC 
GCGGTGAAGA AGACCGCGGC CAAGAAGACC GCTGCCAAGG GCGCCGACGG CGCCGAGGCC 
GGCGCCGGTC CGGCCAAGAA GGCGGCGGCG AAGAAGGCCG CGCCGGGCAA GAAGGCCGCC 
GGCGCGAAGG GCGACGAGGA GGACGGCGAG AGCGTCGAAC TCGAGGAAGA CGTCGACCTG 
GAGATCGAAC TCGACGACGA GGACGCCCCC GATCTGGTGG TCGCCGTCGC CGACGAGGAA 
GGCGAGGAAG CCTCCGAGGG CGACGGGGCC ACCCCCGGCG ACAAGGAGGA GGGCTTCGTC 
CTGTCCGACG ACGAGGACGA CGCCCCCGCC CAGCAGGTCG CCTCCGCCGG CGCCACCGCG 
GACCCGGTGA AGGACTACCT CAAGCAGATC GGCAAGGTCC CGCTGCTCAA CGCCGAGCAG 
GAAGTCGAGC TCGCCAAGCG CATCGAGGCC GGCCTGTTCG CCGAGGAGAA GCTGAACGAC 
GGCGAGCCGC TGACCCCGGA GTTCCGGCGC GAGCTGGACA TCATCGCCGA GGACGGCCGC 
CGGGCCAAGA ACCACCTGCT GGAGGCGAAC CTGCGCCTCG TGGTCTCCCT GGCCAAGCGC 
TACACCGGCC GCGGCATGCT GTTCCTGGAC CTGATCCAGG AGGGCAACCT CGGTCTGATC 
CGCGCGGTCG AGAAGTTCGA CTACACCAAG GGCTACAAGT TCTCGACCTA CGCGACGTGG 
TGGATCCGTC AGGCCATCAC CCGCGCCATG GCCGACCAGG CGCGGACCAT CCGCATCCCG 
GTCCACATGG TCGAGGTCAT CAACAAGCTG GCCCGCGTGC AGCGCCAGAT GCTCCAGGAC 
CTCGGGCGCG AGCCCACCCC GGAGGAGCTG GCCAAGGAAC TGGACATGAC GCCCGAGAAG 
GTCGTCGAGG TCCAGAAGTA CGGCCGCGAG CCGATCTCCC TGCACACCCC CCTGGGCGAG 
GACGGCGACA GCGAGTTCGG CGACCTCATC GAGGACTCCG AGGCGGTCGT CCCGGCCGAC 
GCGGTGTCGT TCACGCTGCT GCAGGAACAG CTGCACTCGG TGCTCGACAC GCTCAGCGAG 
CGGGAGGCCG GCGTGGTGTC CATGCGGTTC GGGCTGACCG ACGGCCAGCC CAAGACGCTG 
GACGAGATCG GCAAGGTCTA CGGGGTCACG CGCGAGCGGA TCCGGCAGAT CGAGTCCAAG 
ACCATGTCGA AGCTGCGGCA CCCGTCGCGC TCGCAGGTTC TGCGGGACTA CCTGGACTAG

Protein sequence

MSASTSRPLP AEIAESAHLV ALIERGRAQG HIAADEVRQA FEEADIPMAK AKSVMRALTT 
VLHEDGVDLT VNAVQSAGVA RKRVAAASKT AAKKTTTATA AKAATVKKAA AKTAAPAVAA 
ANGASEEGAE AGSAAAKKTA AVKKTAAKKT AAKGADGAEA GAGPAKKAAA KKAAPGKKAA 
GAKGDEEDGE SVELEEDVDL EIELDDEDAP DLVVAVADEE GEEASEGDGA TPGDKEEGFV 
LSDDEDDAPA QQVASAGATA DPVKDYLKQI GKVPLLNAEQ EVELAKRIEA GLFAEEKLND 
GEPLTPEFRR ELDIIAEDGR RAKNHLLEAN LRLVVSLAKR YTGRGMLFLD LIQEGNLGLI 
RAVEKFDYTK GYKFSTYATW WIRQAITRAM ADQARTIRIP VHMVEVINKL ARVQRQMLQD 
LGREPTPEEL AKELDMTPEK VVEVQKYGRE PISLHTPLGE DGDSEFGDLI EDSEAVVPAD 
AVSFTLLQEQ LHSVLDTLSE REAGVVSMRF GLTDGQPKTL DEIGKVYGVT RERIRQIESK 
TMSKLRHPSR SQVLRDYLD