Gene Sros_5683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5683
Symbol
ID	8668977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6215947
End bp	6217509
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	76%
IMG OID
Product	Beta-glucosidase-related glycosidase-like protein
Protein accession	YP_003341174
Protein GI	271966978
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0956393
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.544245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCACC ACAGCCCCAC CCTGGCCCGG CTGGCCATGA CCGTGCTCCA GCCCGGCTTC 
GACGGCACCG CACCGCCCGA CTGGCTGCGC CGGGCGCTCT CCGAAGGGCT CGGCGGCGCC 
GTGCTGTTCG CCCGGAATCT CGCCGGCCCG GCGCAGACGG CCGAGCTCGT CGCCGGCCTG 
CGCCGGGAGA ACCCGGCCGT GGTGGTCGCG GTGGACGAGG AAGGCGGAGC GGTCACCCGG 
CTGGAGGCCA GGACCGGCAG CTCCTGGCCG GGCAACCGGG CGCTCGGCGT GGCCGACGAC 
GCCGAGCGCA CCGAGCGGGT CGCCCGCGAG ATCGGCCGCC TCCTCGCCTC GGCCGACATC 
ACCCTCGACT ACGCCCCCGT GGTGGACGTC AACGCCAACC CGGCCAACCC GGTGATCGGC 
ATCCGTTCCT TCGGCCCCGA CCCCGAGCTG GTGTCCCGGC AGACCACCGC CTGGATCACG 
GGGTTGCAGG GCGCCGGGGT GGCCGCCTGC GCCAAGCACT TCCCCGGTCA CGGCGACACC 
GTCACCGACT CCCACCACGC GCTGCCGACC GTCCACGCCG ACCTCGAGCT CCTCCAGGAG 
CGCGACCTGC CTCCGTTCCG CGCGGCCGTC AAGGCCGGGG TCCAGGCCGT GATGTGCGGC 
CACCTGCTGG TGCCCGCACT TGATCCCGGC AACCCCGCCA CGCTGAGCAG GCGGATCCTG 
ACCGGCCTGC TCCGCGAGGA GATGGGCTTC GGCGGCATGC TGGTCACCGA CGCGATCGAG 
ATGGGAGCCG TCGCCGCCCT GCACCCCCCG GGCGAGATAG CGGTCCGCGC GCTGGCCGCG 
GGGGTGGACG CGATCTGCGT CGGCGTGTCC TCGCCCGGCG GGGAGAGCGT CTACGCGCTG 
CGGGACGCGA TCGTGCGGGC CGTACACGAC GGCAGGCTGC CCGAGGAGCG GCTGGCCGAG 
GCGGCGGGAC GCGTGCTGGC CCTGGCCGGC TGGTACGCCG AGAACGCCGC CGCGCGGGCA 
CGGGACACGG AGCGGACGCG GGAGGCGCCG GACGCGGAGG CCCCGGAGGC CCCGGAGGGG 
CGGGGAGGAC GGGATCCGCG AGGGGGAGGC GAGGAGCTCG GCCTGCAGGC CGCCCGCGCG 
GCCATGCGCG TGACCGTCGC GGGCGATCGG ACCGCGCCTC CGCCCGTCCT CTCCCGCCCC 
CCGCTGGTCG TCGACATCGC CCCGCGCCTG AACCTGGCGA TCGACCCCTC CACCCCCACC 
GGCCTCGTCG GCGCCATGAC CGAGCTGCTG CCGGGCACCA CCGGGCACAC CGTCGCCGCC 
GAGACCGCCG ACCTCCCCGA CCTCTCCGAC CACCGGCGCC CGCTTGTCCT GGTGGCGCAC 
GACGCCCCCC GCCACGCGTG GGTCCGGGAC CTGCTGGCCC GCGCCGTCGG GCTGCGCCCC 
GACGCGATCG TGATCGAGAC CGGGCTGCCC GGCGAACCCA CCGGGGCGGT GCACATCGCC 
ACACACGGTA TTTCCCGGGT TTCGGCCCGC GCCGCCGCCC TGTGGCTGAC CGGCGGCCAA 
TAG

Protein sequence

MPHHSPTLAR LAMTVLQPGF DGTAPPDWLR RALSEGLGGA VLFARNLAGP AQTAELVAGL 
RRENPAVVVA VDEEGGAVTR LEARTGSSWP GNRALGVADD AERTERVARE IGRLLASADI 
TLDYAPVVDV NANPANPVIG IRSFGPDPEL VSRQTTAWIT GLQGAGVAAC AKHFPGHGDT 
VTDSHHALPT VHADLELLQE RDLPPFRAAV KAGVQAVMCG HLLVPALDPG NPATLSRRIL 
TGLLREEMGF GGMLVTDAIE MGAVAALHPP GEIAVRALAA GVDAICVGVS SPGGESVYAL 
RDAIVRAVHD GRLPEERLAE AAGRVLALAG WYAENAAARA RDTERTREAP DAEAPEAPEG 
RGGRDPRGGG EELGLQAARA AMRVTVAGDR TAPPPVLSRP PLVVDIAPRL NLAIDPSTPT 
GLVGAMTELL PGTTGHTVAA ETADLPDLSD HRRPLVLVAH DAPRHAWVRD LLARAVGLRP 
DAIVIETGLP GEPTGAVHIA THGISRVSAR AAALWLTGGQ