Gene Sros_1518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1518
Symbol
ID	8664794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1604722
End bp	1606068
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	74%
IMG OID
Product	peptidase M20
Protein accession	YP_003337254
Protein GI	271963058
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0128232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000123266
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGACTCCTG CCGAGATCGA AGGCGCCGTC GCCGCCGGCC TGCCCCAGGC GGTCGAAGAC 
CTCAAGCGGC TCGTCGCCAT CCCCTCGGTG GCCTTCCCCG GCCACCCGGA GGAGCCGGTG 
CGCGCGGCCG CCGCGGCGAC CGAGGAGCTG CTGCGCAGCG CCGGACTGCC GCACGTCCGG 
CAGATTCCGG TCGAGGGAAG CTTCCCCGCC GTCTACGCCG AGGCACCGGC CCCGCCCGGC 
GCGCCGACCG TGCTGCTCTA CGCCCACTAT GACGTGCAGC CCGCGGGCGA CCCCGCGCTG 
TGGCGCACCC CGGCCTTCGA GCCGACGGAG GTCGACGGGG CCATCCACGG CCGCGGCGCC 
GCCGACGACA AGTCCGGCAT CATCTCCCAC GTCGCCGCGC TCCGGGCCTT CCGGGGAGAC 
TTCCCGGTGG GCATCAAGGT GATCATCGAG GGCCAGGAGG AGTACGCCGG GGAGCGCCTT 
GAGGCCTTCG TCGAGCAGAA CCCCGAGCTG CTCCGCGCCG ACGCGATCAT CGTCGCCGAC 
TGCGGCAACC CGAGCGTGGG CGACCCGGCG GTGACCACCT CGCTGCGCGG CATGGGCGCC 
TTCACCGTCG AGGTGCGCAC CCTGAAGGAG TCGCTGCACA GCGGCTCGTT CGGCGGCGCC 
GCCCCGGACG CGCTCGCCGC GCTGATCCGG ATGCTGGCCG GCCTGCACGA CGACCACGGC 
GACATCCGCG TCCCCGGCCT GCCACGCGGC AGCTTCCTCG GCTCCGGCCC CTCGGAGGAG 
GAGTTCCGGG CCACGGCGGG CGTGCTCGAC GGCGTCTCGC TGGTCGGCTC GGGTTCGCTG 
GCCGACCGCC TGTGGGCCTC CTACGCCATC ACGGTCACCG GCCTGGACGT GCCGACCGTC 
TCCGGCGCCA TCAACGCGGT CCAGGCGGTC GCGCGCGCCC GGGTGACCGT ACGCGTGCCT 
CCGGCGGGCG ACCCGAAGAC GACCGTGGAC GCCGTGGTCG ACTTCCTCCG TCAGGTTGCT 
CCCTGGGGTG TCGAGGTCCA CGTCACCGAC TACGTGCTGG GCTCCGGCTA CCTCGCCGAC 
TCCGGCGGAG CCGCCCGCGC CGCGCTGAAC CGGGCGATGG AGCACGCCTT CGGCCGTCCG 
CCGCGCGACG TCGGCGCCGG CGGCTCGATC CCGCTGGTCT CCACGCTCGT CAAGCAGTTC 
CCCGCCGCGT CGATCCTGCT GTTCGGCGCC GAGGACGACG ACGCCTCGAT CCACGCGCCC 
AACGAGCGGG TCAACATCGA GGAGCTCCGC CGCACGGCCC TCGCGGAAGC GCTCTTCCTC 
CAGGAGTACG GCTCCGCGAC GGTCTAG

Protein sequence

MTPAEIEGAV AAGLPQAVED LKRLVAIPSV AFPGHPEEPV RAAAAATEEL LRSAGLPHVR 
QIPVEGSFPA VYAEAPAPPG APTVLLYAHY DVQPAGDPAL WRTPAFEPTE VDGAIHGRGA 
ADDKSGIISH VAALRAFRGD FPVGIKVIIE GQEEYAGERL EAFVEQNPEL LRADAIIVAD 
CGNPSVGDPA VTTSLRGMGA FTVEVRTLKE SLHSGSFGGA APDALAALIR MLAGLHDDHG 
DIRVPGLPRG SFLGSGPSEE EFRATAGVLD GVSLVGSGSL ADRLWASYAI TVTGLDVPTV 
SGAINAVQAV ARARVTVRVP PAGDPKTTVD AVVDFLRQVA PWGVEVHVTD YVLGSGYLAD 
SGGAARAALN RAMEHAFGRP PRDVGAGGSI PLVSTLVKQF PAASILLFGA EDDDASIHAP 
NERVNIEELR RTALAEALFL QEYGSATV