Gene Sros_8079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8079
Symbol
ID	8671407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8902053
End bp	8903213
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	73%
IMG OID
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003343477
Protein GI	271969281
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGATCG GTCGGATGCT CGCCGCGGTG TCGCTGCTGA CGGCGGCCAC GGTGTCGGCG 
GCTCCGGCGG TCGCGTCCGC CGCGGCGGCG CCCGAGAAGT GCGCCCCCGA GCGCGGCACG 
GTGAGCATCG CGGAGTCATG GGGCCAGAAG CGGCTCAACC TGCCCGAGGT GTGGCGGCTG 
ACCAAGGGAG CCGGGGTGAC CGTCGCGGTC CTCGACAGCG GCCTGGACAC CACGCATCCC 
CAGTTGAGGG GGGCCCGCGC GGAGGACGTC ACCGGCACCG GGCCGCGCGA CTGCTACGGC 
CACGGCACCG CGGTGGCGGG CATCATCGCC GCCGTCCCGC ACGCCCGGGT CCTCTTCTCC 
GGGGTCGCGC CGGCGGTGAA GCTGGTCTCC GTCAAATACA CCGTGGAGCG CAGCGGAGAG 
GTCGGCAGGC TGGTCCAGGC CGTCGCCAAG GCCGTCGAGC TCGGCGCCGA CGTGATCAAC 
GTGTCGACCC AGGCGGCCGA CCAGCCCGAC CTGAGCAACG CCATCGCCTA CGCGCTGTCC 
AAGGACGTGG TGGTGGTCGC CGCGGCCGGC AACGTCAACA AGGACGACGG CTCCCCCGTG 
CCCGCCTATC CGGCCTCCTA CGCCGGCGTG CTGTCCGTCG GCTCCGCCGG TCCCGACGGG 
CGCAGAGCCG ACTCCTCGAA CCCGATCACG CCCGTCACCG TGCTGGCTCC CGGCACGGAC 
CTCACCGCCC CCTGGCCCTT CCAGGTCTAC GCGGAGAAAC GGGAGGGCAC CAGCTTCGCC 
GCGGCGTACG TGTCCGGGGT CGCCGCGCTG GTCCGCTCCC GCTATCCGGA GCTGAGCCAG 
GCGGAGGTGG TGCGGCGCAT CGCGCTGACC GCGGACGGCG GCTCCGGGAC CGGCACCGGA 
AAGGGGATGG TCAACCCGCT GCAGGCCGTC TCGGCGATCC TGTCGTCGGA GGCGGTGGCG 
CTCGCGCCGC CGGAGCCCGC CCCGCTGGCG GCCGACGCGA TCCGGCAGGC GCCGCCGGAG 
GACACCCGGA GCATTTCGGT CGCCACGTGG ATCGCCCTGC TGTCGCTCGC CGCCGTCATT 
CTGATCGCCC TGGGTAGCGT CACGATTCCG GCGGGACGTC GTCGCAGGTG GCAGCCGGGA 
GCCCTGGATA ACAGATCGTG A

Protein sequence

MVIGRMLAAV SLLTAATVSA APAVASAAAA PEKCAPERGT VSIAESWGQK RLNLPEVWRL 
TKGAGVTVAV LDSGLDTTHP QLRGARAEDV TGTGPRDCYG HGTAVAGIIA AVPHARVLFS 
GVAPAVKLVS VKYTVERSGE VGRLVQAVAK AVELGADVIN VSTQAADQPD LSNAIAYALS 
KDVVVVAAAG NVNKDDGSPV PAYPASYAGV LSVGSAGPDG RRADSSNPIT PVTVLAPGTD 
LTAPWPFQVY AEKREGTSFA AAYVSGVAAL VRSRYPELSQ AEVVRRIALT ADGGSGTGTG 
KGMVNPLQAV SAILSSEAVA LAPPEPAPLA ADAIRQAPPE DTRSISVATW IALLSLAAVI 
LIALGSVTIP AGRRRRWQPG ALDNRS