Gene Sros_0075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0075
Symbol
ID	8663338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	74314
End bp	76551
Gene Length	2238 bp
Protein Length	745 aa
Translation table	11
GC content	68%
IMG OID
Product	putative terpene cyclase
Protein accession	YP_003335875
Protein GI	271961679
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCTT TCACATTGCC CGAGTTCTAC ATGCCATATC CCGCCAGGAT CAATCCTCAT 
ATGGAGCGTT CCCGCGCGCA CAGTGCGGCC TGGGCCCGGC AGATGGGCAT GCTCGACGCA 
CCCAAGCCCG GCGGCGGCGT CGTGTGGGAC GACGCCGAGC TGGCCAGGAT GGACTACGCG 
CTGATGTGCG CCTACACCCA CCCCGACTGC GACGGCCCCA CCCTGGACCT GATCACCGAC 
TGGTACGTCT GGGTGTTCTT CTTCGACGAC CACTTCCTTG AGCAGTTCAA GTACTCCCGC 
GACCTGCTCG GGGCGAAGGC CTACCTCGAC CACCTCGAAC TGTTCATGAC CGCGGACGGA 
GAGACGCCGC CGGAGCCGGC CAACCCGGCC GAGGCGGGGC TGAAAGACCT CTGGGAGCGT 
ACGGTTCCGG CGATGTCGCA CGGGTGGCGG CAGCGCTTCA TCACCAGCAC GCACAACCTG 
ATGGTGGAGT CGATGTGGGA GCTGGACAAC ATCGACCGCG GCCGGATCGC CAACCCGATC 
GAATACGTGC AGATGCGGCG GAGGGTCGGC GGCGCACCCT GGTCGGCCAA CCTCGTCGAA 
TACGCCGTCG GCGCGGAGAT CCCCGACGGT CTGGCCGGGA CGAGGCCGAT GCGGGTCCTG 
TCGGACACGT TCTCGGACGC GGTGCACCTG CGCAACGACC TGTTCTCCTA CCAGCGCGAG 
GTCCAGGAGG AGGGCGAGAA CTCCAACGCG GTGCTGGTCT TCGAGCGGTT CTTCGACTGC 
CCGACGCAGG AGGCCGCCGA GCTCGTCAAC GACCTGCTGA CCTCCCGGCT GCAGCAGTTC 
GAGAACACGA CGCTGATCGA GGTCCCGGCC CTGCTGGCCG AGAACACCGT GCCCGTGCAC 
GAGCAGCTCG GGGTCGCCGC CTACGTCAAG GGTCTGCAGG ACTGGCAGTC CGGCGGACAC 
GAGTGGCACG CGAGATCCAG CCGGTACATG AACGAAGGCG CCGCCTCGGG CCCCGCCGGT 
GTGCTGAGAG GCCCGACCGG CCTGGGCACC TCCGCCGCCG TACCGACGCT CTCCCCGGCA 
CGGCTGGGCC TGCGGCGCAG GTCCCAGCAG CAGTCCCACA GGCCGTTCCA GCCGGTGGGG 
CATCTGCCGC TGCCGGATCT CTACATGCCC TACCCGGTCC GCACCAGCCC CCACCTGGAC 
GCCGCGCGAC GCTACGCAGT CGGCTGGGCG CGGCGGATGG GCATGTTCGA CGCGATACCC 
GGGGTGGAAG CCGGCGGGTT GTGGGACGAG CGGCGCTTCA TCGGCTTCGA CTTCGCCCAC 
TGCGCCGCGA TGATCCACGC GGACGCGAGC CCCGAACAGC TCAACCTGTC CTCTGACTGG 
CTGGCCTGGG GCACGTACGG TGACGACTAC TTCCCCGCGG TGTTCGGGGC GCCCCGCGAC 
CTCGTGGCGG CGAAGCTCTG CAACGAACGG CTGTCGGCGT TCATGCCGCT GGACGCCGGG 
GCCACCCCGG AGCCGACGAA CCCGATCGAG CGGGGGCTGG AGGACCTGTG GCGGCGCACC 
GCGGAGCCGA TGAGCGTGCC CGCCCGGCAG CAGTTCCGCG AGGCGGTCGA GGACATGACC 
GCCGGCTGGC TGTGGGAGCT GGTCAACCAG ACCCAGCACC GTGTCCCCGA TCCGGTCGAC 
TACATCGAGA TGCGCCGCAA GACGTTCGGG TCGGACATGA CGATGAGCCT GGCCCGGCTC 
GCGCACTCGG ACATGATGCC TGCGGAGATC TACCAGACAC GGGTCATGCG GGAGCTGGAC 
ACCGCGGCGC AGGACTACGC CTGTTTCACC AACGACCTGT TCTCCTACCA GAAGGAGATC 
GAGTTCGAGG GTGAGGTCCA CAACCTCGTC CTGGTCGTGG AGAACTTCCT GGAAGTGGAC 
AGGTGGAAGG CCCGGGACGT CGTGGCCGAC CTGATGACAG CGCGGATGCA GCAGTTCGAG 
CACATCGTCG CCAACGGCCT GCCGGCGCTG TTCGACGATT TCGCCCTCGA CGAGCAGGCC 
CGCAGGATTC TCACCCGCCA TGCCGACGAC CTCAAGGAGT GGATGTCGGG AATCCTCGAA 
TGGCACCGTA GGTGCGCGCG ATACACCGAG GCCGAGCTCC GGCGCAGCCG CCTTCCGGGA 
GCGCCGGCGG GCTTCTCGCT TCTGCCCGCA GGGCTGGGCA CCTCGGCGGT GCGGGTCGGG 
GCCGGCAGGC GGGGCTGA

Protein sequence

MQAFTLPEFY MPYPARINPH MERSRAHSAA WARQMGMLDA PKPGGGVVWD DAELARMDYA 
LMCAYTHPDC DGPTLDLITD WYVWVFFFDD HFLEQFKYSR DLLGAKAYLD HLELFMTADG 
ETPPEPANPA EAGLKDLWER TVPAMSHGWR QRFITSTHNL MVESMWELDN IDRGRIANPI 
EYVQMRRRVG GAPWSANLVE YAVGAEIPDG LAGTRPMRVL SDTFSDAVHL RNDLFSYQRE 
VQEEGENSNA VLVFERFFDC PTQEAAELVN DLLTSRLQQF ENTTLIEVPA LLAENTVPVH 
EQLGVAAYVK GLQDWQSGGH EWHARSSRYM NEGAASGPAG VLRGPTGLGT SAAVPTLSPA 
RLGLRRRSQQ QSHRPFQPVG HLPLPDLYMP YPVRTSPHLD AARRYAVGWA RRMGMFDAIP 
GVEAGGLWDE RRFIGFDFAH CAAMIHADAS PEQLNLSSDW LAWGTYGDDY FPAVFGAPRD 
LVAAKLCNER LSAFMPLDAG ATPEPTNPIE RGLEDLWRRT AEPMSVPARQ QFREAVEDMT 
AGWLWELVNQ TQHRVPDPVD YIEMRRKTFG SDMTMSLARL AHSDMMPAEI YQTRVMRELD 
TAAQDYACFT NDLFSYQKEI EFEGEVHNLV LVVENFLEVD RWKARDVVAD LMTARMQQFE 
HIVANGLPAL FDDFALDEQA RRILTRHADD LKEWMSGILE WHRRCARYTE AELRRSRLPG 
APAGFSLLPA GLGTSAVRVG AGRRG