Gene Svir_18200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_18200
Symbol
ID	8387147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	-
Start bp	1887572
End bp	1888987
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	69%
IMG OID	644975888
Product	subtilisin-like serine protease
Protein accession	YP_003133670
Protein GI	257055838
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCGAT TCAGATCCCT GCTGTTACCC GCCGCCCTGA CCTTGGGCGT CGGCGGTGTG 
CTGGCCGCTC CCGTGGCCGC CGCCGAACCC ACCGCAGCGG CGGAGTGCGA CACCACCAGC 
ACCCCCTACA CCTACGTGGT GCTGTATCAC CCGCGCACGC CGCAAGCCGT GGTCGACGCC 
GAACTGGCCG CCAAGTGCGG GGAGCGGGTC GCCTACTACC CGGAGATCGG GGTGGCGGTG 
GCCAGCTCCC GTAACGCCGA CTTCGCCGAC CGGATCGGTG TCTACCGCGC CTACTCCGGC 
TCCCGCGAGG TCGCCCACCC CGACACGGCG GCCGCGGTGG CCCGGGCGCA GGCTCGTGCG 
GAGGTCGAGA CCGAGGAGAC CGTCGACGTG GTCTCGACCG CGGATCTCTC CGCGCAACAG 
TGGGACATGC ACATGATCCA CGCGCCGGAA GCCCATGCGA TCAATGAGGG CAGTCCCTCG 
GTCACGGTGG GCGTACTGGA CTCCGGGATC GAACCCACTC ACCCGGCGCT GGTCGACTCG 
CTGGACCCGG AAACCTCCGT CGGCTGCAAC ACGGGCGCAC CTGACACCCG CCCCGAGGCG 
TGGGCTTCGA CGAACATCGA CCACGGCACC CACGTCGCCG GCACGATCTC CGGCAAGGAC 
ACCGAGCGCG GTTTCACCGG TGTCGCCCCC GGCGTGCGGA TCGCGTCGGT GAAGGTCGTC 
AACGACGAGG GCTACATCTA CCCCGAAGCG GCGGTCTGCG GTTTCATGTG GGCGGCCGAG 
CACCGTTTCG AGGTGACCAA CAACAGTTAC TACGTCGACC CGGGGATGTT CTACTGTCCG 
AGCCAACCCG GTGACGCGGC GGCCTACGAA GCCGTGCGGC GTGCGGTGGC CTACTCCCAG 
AAGCGGGGCG TGCTCAACGT CGCCGCGGCC GGCAACAGCG ACTTCGACCT GGCGGACCCG 
CCGGCCGACG ACCCCAACCG CCAGCACCCT GTGAACTCCG GGTGCGCCAT CCTGCCCAAG 
GGGCTCGACG GTGTGGTGAC CGTTTCGTCC GTCGGCTACG AAGCCACCAA GTCCTCGTTC 
AGCAACTACG GCCTCCGCGA GGTCGACGTG GCCGCACCGG GTGGCGACCG TGATCAGTTG 
CCCCCGGGAG CGACGTCGGG CTGCATCCTC TCCACGGTGT TCAACGGCCA GTACGGCACC 
AAGTGCGGCA CCTCGATGGC CGCGCCACAC GCCGCCGGAG TGGCCGCGCT GATCGCCAGC 
AAACGTCCCC AGCTTCCGCC GCAGGCCATC TCGGCACTGC TGCGGGCCAA GGCCGACAAC 
ATGCCCTGTC CCGACGACGA CCGGTGCACC GGTCCTGCGG CGTACAACTC GTTCTACGGC 
CACGGGCTCG TGAACGCGCT GGCCGCCGTC AAGTAA

Protein sequence

MSRFRSLLLP AALTLGVGGV LAAPVAAAEP TAAAECDTTS TPYTYVVLYH PRTPQAVVDA 
ELAAKCGERV AYYPEIGVAV ASSRNADFAD RIGVYRAYSG SREVAHPDTA AAVARAQARA 
EVETEETVDV VSTADLSAQQ WDMHMIHAPE AHAINEGSPS VTVGVLDSGI EPTHPALVDS 
LDPETSVGCN TGAPDTRPEA WASTNIDHGT HVAGTISGKD TERGFTGVAP GVRIASVKVV 
NDEGYIYPEA AVCGFMWAAE HRFEVTNNSY YVDPGMFYCP SQPGDAAAYE AVRRAVAYSQ 
KRGVLNVAAA GNSDFDLADP PADDPNRQHP VNSGCAILPK GLDGVVTVSS VGYEATKSSF 
SNYGLREVDV AAPGGDRDQL PPGATSGCIL STVFNGQYGT KCGTSMAAPH AAGVAALIAS 
KRPQLPPQAI SALLRAKADN MPCPDDDRCT GPAAYNSFYG HGLVNALAAV K