Gene Caci_0016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_0016
Symbol
ID	8331340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	17749
End bp	18954
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	70%
IMG OID	644953182
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003110812
Protein GI	256389248
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAT TCGAGCACGA CCCGTACCAG CCGGAGCAGC CCGCCACCGG CGACCCGCAG 
CCGTGGGGCC ACCCGTCTTC CGGGCCGGTG CTCGGTCCGG CCCACGCCTC CGCGTCGGCT 
TACCCGCCGG CCTACCCGTC GGCCTCTTCG CCTTCGCCGG CCGCCTCCGA GCCGATGCCC 
CCGTACACGC CGCCGATCAC CTCGATAACG CCGGGCTATG GCAACCCGGG CGAGGCCGGC 
GGTCTCGGCG GGCCTGGCAG TTTCGGCGGG CCTGGCGGTT TCGGCGGGCC TGGCGGTCCG 
GGCGGTCCCG GATACACCAC GCATCCGGCG TTCTCCCCCG AGCCGCCGCG ACGTCCGCGG 
CGCAAGCGCC GGATGGGCAT GGCCCTGATC ATCGCCGGCA CCATCGCGGC CTCGGCCGCC 
GCCGGAGGCA TCGCGGGGAC CATAGCCAGC CACAACAACT CCTCCAACAG CGCCTCCTCG 
AGCGTGCCGC TGAACAACAC GAGCGTGAAC ACCCCGGTCA GCAACCAGAC CGGTACACCG 
ACCACCACGG TCGGCCAGGT CGCCAAGGCC GCACTGCCCA CGGTGGTCCA GGTCTCGGTG 
GAGTCCTATC AGGGCAAGTC GGTCGGCTCC GGCGTCATCC TGACCGCCGA CGGCCTGATC 
CTCACGAACA ACCATGTGAT CACCGACGCG GCCAACGGCA ACGGCCAGAT CACCATCACC 
TTCAACAACG GCAAGACCGC CCAGGCGAGC ATCGTCGGCT ACGACAGCGG CAGCGACCTG 
GCGGTGATCA AGGCGCAGAG CGTCAGCGGC CTGCCCACCG CCAGCCTCGG CGACAGCAGC 
AAGATCCAGA TCGGCGACAC GGTGGTCGCC ATCGGCTCCC CCGACGGCCT GCAGAGCACG 
GTGACCAGCG GCATCGTCAG CGCCCTGAAC CGCCAGGTGA CGGTCAGCAG CGAGTCCTCG 
AGCCGGTTCT CCAGCGGCAG CCAGGTCACC TACAGCGCGA TCCAGACCGA CGCCAGCCTC 
AACCCCGGCA ACAGCGGCGG CCCGCTGCTG AACGCCCAGG GCCAGGTCAT AGGCATCAAC 
TCGGCCATCT ACTCGCCGAC CAGCTCCGCC AACGCCCAGG GCGGCAGCGT CGGACTCGGC 
TTCTCGATCC CGATCGACCA GGTCAAGACC ATGCTCGCCA AGCTCGAAGG CGGTCAGATG 
AGCTAG

Protein sequence

MTGFEHDPYQ PEQPATGDPQ PWGHPSSGPV LGPAHASASA YPPAYPSASS PSPAASEPMP 
PYTPPITSIT PGYGNPGEAG GLGGPGSFGG PGGFGGPGGP GGPGYTTHPA FSPEPPRRPR 
RKRRMGMALI IAGTIAASAA AGGIAGTIAS HNNSSNSASS SVPLNNTSVN TPVSNQTGTP 
TTTVGQVAKA ALPTVVQVSV ESYQGKSVGS GVILTADGLI LTNNHVITDA ANGNGQITIT 
FNNGKTAQAS IVGYDSGSDL AVIKAQSVSG LPTASLGDSS KIQIGDTVVA IGSPDGLQST 
VTSGIVSALN RQVTVSSESS SRFSSGSQVT YSAIQTDASL NPGNSGGPLL NAQGQVIGIN 
SAIYSPTSSA NAQGGSVGLG FSIPIDQVKT MLAKLEGGQM S