Gene Ksed_21640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ksed_21640
Symbol
ID	8373668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Kytococcus sedentarius DSM 20547
Kingdom	Bacteria
Replicon accession	NC_013169
Strand	+
Start bp	2243428
End bp	2244681
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	72%
IMG OID	644992410
Product	trypsin-like serine protease with C-terminal PDZ domain
Protein accession	YP_003149916
Protein GI	256825956
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.00345268
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0571371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGC ACGGGCAGGA CGAGCCGTAC GGCCAGGGTG ACCAGTACCC GCCCTACAGC 
TCGTCGAGGC AGTACGAGGA CGCCCCGCAG CGTTCGCGTG GCTGGTGGCA GGTGCCCACC 
GCCGCGGTGC TGTCGGCTGC CCTGGCCACC GCCGGTACCT GGACGCTGGC GGAGAACGGA 
GTCATCGGTT CCGGGGGCAG CACCTCCCCC TCGGAGAGCC AGGTGGCGCA GGGCGAGCCC 
GCCAGCGACC GCCAGGACGG CGCCGGTGAG TCCGACGGCT CCGGTGACGG CGCCGAGTCG 
GGCGACGGCG CGAAGGCCGC CCCCGTGGCG ACCGCCGACG GTGTCGACTG GTCCGGGGTG 
GCCGAGCAGG TCTCCCCCAG CGTGGTCGCC ATCTCGGTGG CCAGTGCCAC GGCGGGTGGG 
TCGGGCTCCG GCGTGATCCT CGACGAGCAG GGCCACGTGG TCACCAACGA CCACGTCGTC 
AGCGGCGCTC AGGACATCCG GGTGACCATC GGCGACAACC GGGCGTACGA CGCCACCGTC 
GTGGGCACCG ACCCTGAGAC GGACCTCGCG GTCCTGAAGA TCGACCAGGC GCCCGAGGAC 
CTGCAGCCGA TCACGGTCGG GGACGACAAG GAGCTCAACG TCGGCGACCC TGTGATGGCT 
GTGGGTAACC CGCTGGGCCT CTCGGGCACC GTGACCACCG GCATCGTCAG CGCGCTGGAC 
CGCCCGGTCC GGGCCGGTGA CGCCGAGACC CAGGTGGTGA CGAACGCGGT GCAGACCTCC 
GCGGCGATCA ACCCGGGAAA CTCCGGCGGC GCGCTGGTGA ACTCCGCCGG CGAGCTGGTG 
GGCATCAACT CCAGCATCGC CACCCTGGGC TCCAACGGCC AGGAGGGCGG CAACATCGGC 
ATCGGGTTCG CCATCACGGC CACCCAGATG AAGAACGTCA CCAGCGAGCT CATCGAGACC 
GGCAAGGCCA CCCACGCGCA GCTGGGCGTC CGGGTCACCG ACGCCACGGT GCAGGTCGAC 
GGCGCCCACG TGAACGGCGC CGGCATCGCG TCGGTGGAGC CGAACACCGC CGCGGCCGAG 
GCCGGGCTCG AGGAGGGCGA CGTGGTGGTG GCCATCGACG GTGAGTCGGT GGACAGCATG 
TGGGCCCTCA TCGCCCAGAT GCACGAACGA GCCGTCGGCG AGACCGCCAC CGTCACGGTG 
GTGCGCGACG GCGAGCGCCA GGACGTGGAG GTGACCGCCG GCGCCAAGGA ATGA

Protein sequence

MTQHGQDEPY GQGDQYPPYS SSRQYEDAPQ RSRGWWQVPT AAVLSAALAT AGTWTLAENG 
VIGSGGSTSP SESQVAQGEP ASDRQDGAGE SDGSGDGAES GDGAKAAPVA TADGVDWSGV 
AEQVSPSVVA ISVASATAGG SGSGVILDEQ GHVVTNDHVV SGAQDIRVTI GDNRAYDATV 
VGTDPETDLA VLKIDQAPED LQPITVGDDK ELNVGDPVMA VGNPLGLSGT VTTGIVSALD 
RPVRAGDAET QVVTNAVQTS AAINPGNSGG ALVNSAGELV GINSSIATLG SNGQEGGNIG 
IGFAITATQM KNVTSELIET GKATHAQLGV RVTDATVQVD GAHVNGAGIA SVEPNTAAAE 
AGLEEGDVVV AIDGESVDSM WALIAQMHER AVGETATVTV VRDGERQDVE VTAGAKE