Gene Ksed_21910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_21910
Symbol
ID	8373695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	2266358
End bp	2268118
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	70%
IMG OID	644992435
Product	subtilisin-like serine protease
Protein accession	YP_003149941
Protein GI	256825981
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.164253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACACA CACGCGCCTC CTTCGGCTTC CTCGCCGCCG CCGTCGTCGG CCTCGGCACC 
ATGACCCCCG CCTCAGCCGG CCTCACCACC GAGCCGCACC TACAGCAGCC GCACCCCTCC 
ACCGAGATCT CGCAGCAGGC CGAGGTCCTG TCCGTCGCGG ACGCCAACTA CATCGTGATG 
CTCGAGCTGC CGTCGGCCGC CAAGCGCGGC CCGAACGCCA TGGCCAGCGC CCAGGGCAAG 
GCCGCCGTGG CCGCCGCCAC CCAGAAGCAG GCCGACAAGT GGAGCGCGAA GGGCGTCAAG 
GTCAAGCAGC GTTACGAGGC CCTCGGCGGC TTCAGCGCCC ACCTCACTCC CGCCCAGGTG 
GAGGCGCTGC GCAACGACCC GGCCGTCTCC ACGGTGACCG AGAACAAGAT GGTCTCCATC 
GACGCCACCC AGTACAGCGC CCCCTGGGGT CTGGACCGTG TCGACCAGGA CGACCTGCCG 
CTGAACGGCA CCTACAACTA CACCGAGACC GGCCAGGGCG TCACCTCCTA CGTGCTGGAC 
ACCGGCATCC TCGCCAACCA CTCCGACCTC GGCGGTCGGG TGCAGGCCGG CGTGACCGCC 
ATCGACGACG GCCGCGGGTC GGCCGACTGC AACGGCCACG GAACCCACGT CGCCGGCACC 
GTCGGCGGCA CCAGGTACGG CGTCGCCAAG GGCACCACCC TGGTCCCGGT CCGCGTGCTC 
GGGTGCAACG GCAGCGGCTC GACGAACGGG ATCATTTCCG CCATGGACTG GGTGGCCCAG 
AACAAGTCCG GCCCCTCGGT GGCCAACATG AGCCTCGGCG GCGGCGCGGA CGCGGCCACC 
GACCAGGGCA TCGCCCGCAT GACCTCCGCC GGTGTCATCA CCGTCGTGGC GGCCGGCAAC 
GACACCGACA ACGCGTGCAA CTACTCGCCC GCCCGCGCCT CCTCGGCCAT CACCGTCGGC 
TCCACCGACA AGACCGACGG CCTGTCCTAT TTCTCCAACT ACGGCTCCTG CGTAGACATC 
CTCGCGCCGG GCTCGGACAT CACGTCCGCC TGGTACACCA GCAGCAGCGC CACGAACACG 
ATCTCGGGCA CCTCGATGGC GTCCCCGCAC GTGGCCGGCG CCGCGGCGCT CTACCTGCAG 
AAGAACCCCA ACGCCAGCGT CTCGCAGGTG ACCAACGCCC TGACCTCCAC GGCCACCACC 
AACACCATCA CCGGCGTCAA CGGGTCGCCC AACCGCTTCC TGGACACCAC GGCCCTGATG 
GGTGGCGCCA CGCCCACCGA CCCCACTGAC CCCACCGACC CGACCGACCC CACGCCGGGC 
ACCAGCCTGG TGAACGGTGA CTTCGAGCAG GGCAGCACCG GCTGGGGTGG CGCCACCTCG 
GCCATCACCT CCGGCCGGTA CTCGGCCTAC AGCGGCAACT ACAAGGCGCT GCTGGGCGGC 
AAGGGGTACA GCAACACCTC CATCCTGACC CAGCGGTTCA AGGTGCCCTC CAACGCGACC 
TCCCTGCGCT TCGCGCTGAA CGTGCAGTCG GGTGAGTCGA CCTACAGGGC CTACGACCGC 
TTCCAGGTGC AGGCGGTCGA CTCCAGCGGC AGCACCTCGG TGCTGGGCGA GTGGTCCAAC 
CGCGACCAGT CGAGCACCTA CTCGCTGAAG ACGCTGGACA TCTCGCGCTA CGCGGGGCAG 
ACGATCACCC TGCGGTTCGC CGCTCAGGAG GACGTCTCGG TGCAGACCTC GTTCAACGTG 
GACGCCGTCA CGGTGCGGTG A

Protein sequence

MSHTRASFGF LAAAVVGLGT MTPASAGLTT EPHLQQPHPS TEISQQAEVL SVADANYIVM 
LELPSAAKRG PNAMASAQGK AAVAAATQKQ ADKWSAKGVK VKQRYEALGG FSAHLTPAQV 
EALRNDPAVS TVTENKMVSI DATQYSAPWG LDRVDQDDLP LNGTYNYTET GQGVTSYVLD 
TGILANHSDL GGRVQAGVTA IDDGRGSADC NGHGTHVAGT VGGTRYGVAK GTTLVPVRVL 
GCNGSGSTNG IISAMDWVAQ NKSGPSVANM SLGGGADAAT DQGIARMTSA GVITVVAAGN 
DTDNACNYSP ARASSAITVG STDKTDGLSY FSNYGSCVDI LAPGSDITSA WYTSSSATNT 
ISGTSMASPH VAGAAALYLQ KNPNASVSQV TNALTSTATT NTITGVNGSP NRFLDTTALM 
GGATPTDPTD PTDPTDPTPG TSLVNGDFEQ GSTGWGGATS AITSGRYSAY SGNYKALLGG 
KGYSNTSILT QRFKVPSNAT SLRFALNVQS GESTYRAYDR FQVQAVDSSG STSVLGEWSN 
RDQSSTYSLK TLDISRYAGQ TITLRFAAQE DVSVQTSFNV DAVTVR