Gene Caci_5298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5298
Symbol
ID	8336652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	6106407
End bp	6107591
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	73%
IMG OID	644958396
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003115998
Protein GI	256394434
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.111047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACC ACGCAGCGCG GATGGCTCGG ATCCTCGAGA CGCACCAGGA TGTCGTCCAC 
GTCGGCGGCT CCACCGAGGC GCTGATCAAG CGCGACGAGC TGCTGGTGCT CGGTGCGCAC 
GCGGACGCGG TGCACGAGCA GGCGCGGCAG TGGGTGGACT CCCGGGAGGA CTTCGCCGAG 
CTGGGGGTCA GCCGCCTGCG GCTGCGGGCC GGCGCCGGGG TGGACGCCGC GGATCTGACG 
CACAGCCTGC GGGGCGGCGC GGGGGCGCAC CGGCGGACGA GCGTCACGCC CAACCACGTC 
ATGAGCGGGG CGCCGAACTG GACCGGCGGT CCCTTCGGCG CGCCGACGCC CGCCGCAGAC 
CTGCCCGCCC CGGTCGACGC CGAAGGCGGC GGCCGGCGGG CCACGATCGG GATCCTGGAC 
ACCGGGATCG ACCCGCACCC GTGGTTCGCC GAGGCGGACT GGTACCAGGC CTGCACCGAG 
ACAGAGCACG AAGACCTGGA CCCGGCGTCC GAGGACGACC TGGAGTCCGA CTCCGGCCAC 
GGCACGTTCA TCGCCGGCGT GATCCTGCAG CACGCTCCGG GAACCTATCT GCGGGTGCAG 
CGGGTCCTGG GCACCGACGG CGTCACCGAC GAGCTGGAAC TGCTGCACGG TCTGAGGCGG 
CTGCACGCCC GGGCGGCCGC CGAGAGCAAC CGTCTGGACG TCCTGAACCT GTCACTGGGC 
TGCTTCACCT TCGACGACCG GCCCTCCCCG GTCCTGGCCG ACGCCTTCGC GCGGGTCGCC 
CGGCACTCGG TGATCGTCGC CGCCGCCGGG AACCACTCCT CGGACCGTCC CTACTGGCCC 
GCCGCCCTCA AGGACGTCGT CGCCGTCGCG GCTCTGGCCC AGGCGGACAC CGACGGCCCG 
GAGCGCGCGT CCTTCTCCAA CTACGGCTGG TGGGTGGACG CCTCGGCGCC GGGCGAGAAG 
GTCTCCAGCA GCTTCCTGAC CCACGGCCGG GAGAACGGGG AAGACTTCCA CGGCTTCGCG 
ACCTGGAGCG GCACCAGCTT CGCCGCCCCG TACGTGGCCG GTAAGATCGC CGCTTTGATG 
TCCGCCAAGG ACATGACGGC GCGCGACGCC CTCAGCGAGC TGCTCGACCC GGCCAACACC 
CGCATCCCCG ACCTGGGGGT GGTGGTGGCC TCGGACGGCC GCTGA

Protein sequence

MTDHAARMAR ILETHQDVVH VGGSTEALIK RDELLVLGAH ADAVHEQARQ WVDSREDFAE 
LGVSRLRLRA GAGVDAADLT HSLRGGAGAH RRTSVTPNHV MSGAPNWTGG PFGAPTPAAD 
LPAPVDAEGG GRRATIGILD TGIDPHPWFA EADWYQACTE TEHEDLDPAS EDDLESDSGH 
GTFIAGVILQ HAPGTYLRVQ RVLGTDGVTD ELELLHGLRR LHARAAAESN RLDVLNLSLG 
CFTFDDRPSP VLADAFARVA RHSVIVAAAG NHSSDRPYWP AALKDVVAVA ALAQADTDGP 
ERASFSNYGW WVDASAPGEK VSSSFLTHGR ENGEDFHGFA TWSGTSFAAP YVAGKIAALM 
SAKDMTARDA LSELLDPANT RIPDLGVVVA SDGR