Gene Sros_3305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3305
Symbol
ID	8666593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3599515
End bp	3600939
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	71%
IMG OID
Product	Beta-glucosidase
Protein accession	YP_003338987
Protein GI	271964791
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.40854
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGC AAGAGACGCG GATTCAGACC CCGGATCTGG TGTTCCCGAC AGGCTTCGTC 
TGGGGCGCGG CCACCTCCGC CTACCAGATC GAAGGCGCGG TCTCCGAGGA CGGCCGCGGC 
CGATCCATCT GGGACACCTT CGTCCAGCAG CCCGGCCGGG TGGTCAACGG CGAGAACGCC 
GACGTCGCCA TCGACCACTA CCACCGTTAC CGCGACGACG TCCGGATGAT GGCCGACCTC 
GGCCTGGGCG CCTACCGGTT CTCCGTCTCC TGGCCCCGGA TCCAGCCCGA CGGCAGCGGC 
GCGATCAACT CCAAGGGCCT CGACTTCTAC AGCCGGCTGG TCGACGAGCT GCTGGCGAGC 
GGCGTCGACC CGTGGGTGAC GCTCTATCAC TGGGACCTGC CGCAGGCCCT GGAGGACGCG 
GGCGGCTGGC CGTCACGGGA AACGTCGAAG CGCTTCGCCG ACTACGCGGC GGCCGTACAC 
GACGCGCTCG GCGACCGGGT CCGCAACTGG AGCACGATCA ACGAGCCGTG GTGCGCGGCG 
TTCCTGGGAT ACGCCTCCGG TGAGCACGCC CCCGGGCGGC GCGAGCCGGC GCAGGCGGTG 
CGCGCCGCCC ACCACCTCCT CCTCGCGCAC GGCCTGGCCA CCTCGGCCAT GCGCGCCCAG 
CGGGCCGACA GCAGGATCGG CGGCAGCGTC AACCTCTACG CGATCTCGCC GCAGACCGGC 
TCCGAGGCCG ACCAGGACGC CGCCCGCCGC ATCGACGGCC TGCAGAACCG CTTCTTCCTG 
GACGCGCTGC TGAAGGGCGA GTACCCGGCC GACGTCCTGG AGGACCTCGC CGAGGTGCCT 
GGGTTCGTCC AGGACGGGGA CATGAAGGTC ATCTCCGCCC CGCTGGACAT GCTGCTGATC 
AACTACTACA GCCGCTTCAC CGTCTCGGGC ACCCCCGGCG GCGCGGCGTC GGCCGCGGCG 
GCCCCCACCG GCACCGGGTC GCCGTGGGTC GGCAGCGAGG ACGTGTCGTT CGTCGAGGGC 
GGGCGGCCGG TCACCGCGAT GGGCTGGGAG ATCGACGACA GCGGGCTGCA CGAGATCCTG 
CTGCGGCTGG CCCGGGAGTA CCCGCGGATC CCGCTGGTCA TCTCCGAGAA CGGCGCGGCC 
TTCGACGACG TCGTGGGCGC CGACGGCGTC GTGCACGACC ACGATCGCCT GAACTACATC 
GACGCCCACC TGCGCACCTG CCACGCCGCG ATCGAGGCCG GGGTGCCGCT GGAGGGCTAC 
TTCGCCTGGT CGCTGATGGA CAACTTCGAG TGGGCGTGGG GGTACGGCAA GCGTTTCGGG 
CTGGTGCGCG TCGACTACGA GTCGCAGCTG AGAGTTCCCA AAGAGAGCGC TCTCTGGTAT 
GCCGGGACAA TCAGGCGTGG AGGCCTGAGC GGTCCGGCAG AATAA

Protein sequence

MTTQETRIQT PDLVFPTGFV WGAATSAYQI EGAVSEDGRG RSIWDTFVQQ PGRVVNGENA 
DVAIDHYHRY RDDVRMMADL GLGAYRFSVS WPRIQPDGSG AINSKGLDFY SRLVDELLAS 
GVDPWVTLYH WDLPQALEDA GGWPSRETSK RFADYAAAVH DALGDRVRNW STINEPWCAA 
FLGYASGEHA PGRREPAQAV RAAHHLLLAH GLATSAMRAQ RADSRIGGSV NLYAISPQTG 
SEADQDAARR IDGLQNRFFL DALLKGEYPA DVLEDLAEVP GFVQDGDMKV ISAPLDMLLI 
NYYSRFTVSG TPGGAASAAA APTGTGSPWV GSEDVSFVEG GRPVTAMGWE IDDSGLHEIL 
LRLAREYPRI PLVISENGAA FDDVVGADGV VHDHDRLNYI DAHLRTCHAA IEAGVPLEGY 
FAWSLMDNFE WAWGYGKRFG LVRVDYESQL RVPKESALWY AGTIRRGGLS GPAE