Gene Sros_1806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1806
Symbol
ID	8665084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	1928726
End bp	1929997
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	68%
IMG OID
Product	macrolide glycosyltransferase
Protein accession	YP_003337539
Protein GI	271963343
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCTCA CGATCCTGTT CATGCCGGAG AGCGCCTACG GGCCGACGAA CAACTGCATC 
GGCATCGGTG ACATTCTCCG CAAGCGCGGC CACCGCGTCG TCTTCGCAGC TGAAGCCTCC 
TGGAAGGGGA AATTGGAGGC TCTTGGATTC GAAGAGGATC TGGTGGATCT CGCGCCGCCG 
TCCGAAGAGG AGCAGGACCC CGGACAGTTC TGGAAGGACT TCATCCGGGA CACCGCGCCG 
GAATATCGCA AGTCGACCTC GGCTCAGCTG GAGACGGTGA CCAAGCCGAT CTGGGAGGCG 
CTCGTCGACG GCGCGAAGTA CTGCGAGCCT CAGCTGAAGG CGATTATCGA GCGCGTTCAG 
CCGGACGTGA TCGTCGAGGA CAATGTCATC ACCTTCCCGG CGCTGCTCAC GGCCGGTAAG 
CCGTTCGTCC GCATCGTCTC CTGCAACCCG CTGGAGGTGC GCGGCGAGGG CGTCGCCCCG 
GTCTTCTCCG GCCTGCCCGC CGACGACCGG TCCGAGTGGG ACGCCTTCCG CGCCGAGTAC 
GACCGGACCC ACCGCGAGCT CTGGACCGCC TTCAACGAGT GGGTCGTCGC CCAGGGCGCC 
CGGCCGCTGC CCGAGCTGGA CTTCATCCAC GAGGGCGACC TGAACCTCTA CGTCTTCCCG 
GAGATCGCCG ACTACACCGA CGCCCGGCCG CTGGACGGCT CCTGGCACCG CCTGGACTCC 
TCGGTCCGCG AGACCGACGG CGGCTTCGAG CTGCCCGCGT CGCTGGCCGA CCGGGACGGC 
GCGCTGGTCT ACTTCTCGCT CGGCTCGCTC GGCTCGGCGG ACGTCTCGCT GATGCAGCGG 
GTCATCGACG TGCTCGGCAC CACCCCGCAC CGGTTCATCG TCTCCAAGGG CCCGCTGCAC 
GAGGAGATCA AGCTCGCCGA CAACATGTGG GGAGCCGAGT TCGTCCCGCA GACGAAGATC 
ATCCCCATGG CGGACCTGGT GATCACGCAC GGTGGCAACA ACACCACCAC CGAGGCGCTG 
CACTTCGGCA AGCCGATGAT CCTGCTGCCC CTGTTCTGGG ACCAGTACGA CAACGCGCAG 
CGGATCCACG AGCTCGGCTA CGGCGTCCGC CTGGCCACCT ACACCTTCAC CGACGAAGAG 
CTGACCGGCG CGCTGGACAG GCTGCTCGGC GACGCGGGGC TCCGTGAGCG CCTGGCCGCG 
GCCGGCGAGG AGATCCGCCG GCGTGACGGC CTGCGCAAGG CCGCCGACCT GATCGAGCAG 
GCCGGCGCCT GA

Protein sequence

MSLTILFMPE SAYGPTNNCI GIGDILRKRG HRVVFAAEAS WKGKLEALGF EEDLVDLAPP 
SEEEQDPGQF WKDFIRDTAP EYRKSTSAQL ETVTKPIWEA LVDGAKYCEP QLKAIIERVQ 
PDVIVEDNVI TFPALLTAGK PFVRIVSCNP LEVRGEGVAP VFSGLPADDR SEWDAFRAEY 
DRTHRELWTA FNEWVVAQGA RPLPELDFIH EGDLNLYVFP EIADYTDARP LDGSWHRLDS 
SVRETDGGFE LPASLADRDG ALVYFSLGSL GSADVSLMQR VIDVLGTTPH RFIVSKGPLH 
EEIKLADNMW GAEFVPQTKI IPMADLVITH GGNNTTTEAL HFGKPMILLP LFWDQYDNAQ 
RIHELGYGVR LATYTFTDEE LTGALDRLLG DAGLRERLAA AGEEIRRRDG LRKAADLIEQ 
AGA