Gene Caci_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1899
Symbol
ID	8333242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	2154531
End bp	2155970
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	69%
IMG OID	644955048
Product	protease-like protein
Protein accession	YP_003112660
Protein GI	256391096
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.116716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCC GCAAACGTGC CACCCGTGCC GGCGCGCTGT CCCTCGCGAT CGCGAGCGCG 
TTCGCCCTGG CTGCTTCCTC TGCTGCGTCC ACTGTGACGT CGGCGGGGAT CCAGGGGTCC 
GGCAAGAGCG TCCAGGCGCA CCCCATGACC TGGGGGAGCC GGGAGGTGGC TGATCTGCCG 
ACGCCGTTGC CGACCTCGCA ATGCAAGGCT CAGCTCGGTA TCAACTGCTA CAGCCCTCTG 
CAGTACCGCA GTGCCTATGA CCTGAACCCC CTGTACCAGG CGGGGATCAC CGGTCGGGGG 
AAGACGATCG TGATCGTCGA CTCCTACGGA TCGCCGACCA TCCAGGCCGA CTTGGACGTC 
TTCGACAAGC AGTGGGGTCT GCCGGACACC AAGGTGGACG TGCGGCAGTT CGGGACCATC 
CCGGCGTTCG ACCCGACCGA CTCCACCATG GTCGGGTGGG CCGACGAGAC GACGCTGGAC 
GTCGAGTACG CGCACGCGAT CGCCCCCGGC GCGAAGATCG TGCTGGCCGA GACCGCGGTC 
GCCGAGACCG AGGGCGTCAC GGGCCTGCCG GAGATGATGA ACGCTGAGAA GTCGCTCATC 
GACGCCGGGG TCCCGGACGT GATCTCGCAG AGCTTCGGCG CGACCGAGGA CACGTTCCCC 
GGGTTCGACC AGCACGACTA CTCCTCGCTG ACGAACCTGC GCTACGCGTT CAAGGACGCC 
GCGGCGCACC ACGTGACCGT GCTGGGCTCC TCCGGCGACA ACGGCGTGAC CAGCCAGACC 
CTCGACGGCA ACGGCTTCTT CCCGTACGCG GCGAACTCCT GGCCCTCCTC CGACCCGCTG 
GTCACCTCGA TCGGCGGCAC GTACCCGGCG ATCGACGACA CCGGCAAGCG CCTGGCGCCC 
GACGTCACCG GCAACGACAA CGACCTGCTC TACCCGGGCG GCGTCGTCGG CGGCGGCGGC 
CAGTCCCACG TCTTCAAGCG CCCGGACTAC CAGAACAGCG TCAAGAGCGT CGTCGGCGCC 
CAGCGCGGCA CCCCCGACGT CTCCTTCAGC GCCACCCTGT CCGGCGCGGC ATGGGTGTAC 
TACAGCTTCA CCAACCCGGG CTGGCACCTG ATCGCCGGCA CCAGCGAGTC CTGCCCGATC 
ATGTCCGGCG TCGTCGCCCT CGCCGCCCAG GCCGCCGGCC ACCGCCTCGG CAACATCAAC 
CCGGCCCTGT ACGAACTGGG CCAGGTGTCG AAGAACCCGG CCTTCGGCAA GTACACCGGC 
ATCCAGGACG TGACCGTCGG CAACATCAGC GACAACGGCG TCACCGGCCC GAACGCCGGA 
CCCGGCTACG ACATGGCCAC CGGCTGGGGC ACCATCGACG GAGCCCGCTT CGTCCCGGCC 
CTGGCGATCG CCGCCTCCGC CCCGAGCAAT CAGGGCAACC GGGAGGATCA GGGGCACTGA

Protein sequence

MSTRKRATRA GALSLAIASA FALAASSAAS TVTSAGIQGS GKSVQAHPMT WGSREVADLP 
TPLPTSQCKA QLGINCYSPL QYRSAYDLNP LYQAGITGRG KTIVIVDSYG SPTIQADLDV 
FDKQWGLPDT KVDVRQFGTI PAFDPTDSTM VGWADETTLD VEYAHAIAPG AKIVLAETAV 
AETEGVTGLP EMMNAEKSLI DAGVPDVISQ SFGATEDTFP GFDQHDYSSL TNLRYAFKDA 
AAHHVTVLGS SGDNGVTSQT LDGNGFFPYA ANSWPSSDPL VTSIGGTYPA IDDTGKRLAP 
DVTGNDNDLL YPGGVVGGGG QSHVFKRPDY QNSVKSVVGA QRGTPDVSFS ATLSGAAWVY 
YSFTNPGWHL IAGTSESCPI MSGVVALAAQ AAGHRLGNIN PALYELGQVS KNPAFGKYTG 
IQDVTVGNIS DNGVTGPNAG PGYDMATGWG TIDGARFVPA LAIAASAPSN QGNREDQGH