Gene Sros_6820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6820
Symbol
ID	8670130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	7507044
End bp	7508282
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	75%
IMG OID
Product	peptidase M20
Protein accession	YP_003342270
Protein GI	271968074
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.547293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0081642
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAACCTCC GCCTGATGCT TGAGGACCTG GAGGAGCTCG TCTCGTGCGA GTCGTTCTCC 
GCCGACCACG AGGCGGTGGC CCGCAGCGCC CGGGTGGTCG CCGACCAGGG GCTGCGCAGG 
CTCGGCACGC GCCCCGAGAC GATCGTGATC GACGGGGTCA CCCACCTGCG GTGGACCTTC 
GGCACGCCCC GGGTCCTGCT GGTCGGCCAC CACGACACCG TCTGGCCGAT CGGGACGCTC 
GCCGAACATC CCTGGTCGCT GGTGGACGGG ATCGCCCGCG GGCCCGGGGT GTTCGACATG 
AAGGCCGGGC TGGTGCAGGC CTTCCACGCG CTGGCCGCGC TGCCGTCGCC GGAAGGGGTG 
TGCCTGCTGG TCACCGGGGA CGAGGAGGTC GGCTCACCGT CCTCGCGCGC GCTGATCGAG 
GAGTCGGCGC GCGGCTGCGC GGCCGCGTTC GTGCTGGAGG CCGGCGCCGA CGGCGGCGCG 
CTCAAGACCG CGCGCAAGGG CACCTCCAAC TACGCGGTCA CCGTGCACGG CAGGGCCGCG 
CACGCGGGCC TGGAGCCCGA GAGGGGTGCC AACGCCGGGA TCGAGCTGGC CCACCAGATC 
CTCGCGCTCG GCGCGATCGC CCTGTCGGCG GACGACGGGG CGGCACCGGA CGGTCTGGGC 
CCGACCACGG TCACCCCGAC CGTGCTGTCC GGGGGCACCA CGACCAACAC CGTGCCCGCG 
CTCGCCAGCG TGGAGGTGGA TGTGCGGGTG CCCACCCTCG CCGCGCAGGC GCGGGTGGAC 
GAGATGGTAC GGGCGCTCGC CCCCCGGACC CCGGGGACCC GGCTGGAGGT GAGCGGCGGG 
CCGAACCGCC CTCCCCTGGA GCAGGCCTCG TCGGCGCGCC TGTTCGAACT GGCCTGCCGG 
ATCGCCAAGG ATCTGGGTAT GGAACCGCCG CGTGGGGTGG CCGTGGGCGG CGCGTCCGAC 
GGCAACTTCA CCGCGGGGAT CGGCTGCCCG ACCCTCGACG GGCTCGGCGC GGTGGGCGGC 
GGCGCCCATG CCGCACACGA GCACGTGGTC GTCGAGGAGA TGCCCGGCCG GACGAGGCTG 
CTGACCGGGC TGATCGCCTC GGTCCTCGGA GGGGAGCCCC CTGCGGGAGC GGTGGCCACG 
GAAGCGGCGG TCACGGGAGA GGCGGCCGCG GGAAGGACCT CGCCGGCGGC GGGGAGTTCG 
GCGACCGCGG GAGAGTCCCC GGGGGAGGCC GGCAGGTGA

Protein sequence

MNLRLMLEDL EELVSCESFS ADHEAVARSA RVVADQGLRR LGTRPETIVI DGVTHLRWTF 
GTPRVLLVGH HDTVWPIGTL AEHPWSLVDG IARGPGVFDM KAGLVQAFHA LAALPSPEGV 
CLLVTGDEEV GSPSSRALIE ESARGCAAAF VLEAGADGGA LKTARKGTSN YAVTVHGRAA 
HAGLEPERGA NAGIELAHQI LALGAIALSA DDGAAPDGLG PTTVTPTVLS GGTTTNTVPA 
LASVEVDVRV PTLAAQARVD EMVRALAPRT PGTRLEVSGG PNRPPLEQAS SARLFELACR 
IAKDLGMEPP RGVAVGGASD GNFTAGIGCP TLDGLGAVGG GAHAAHEHVV VEEMPGRTRL 
LTGLIASVLG GEPPAGAVAT EAAVTGEAAA GRTSPAAGSS ATAGESPGEA GR