Gene Sros_3535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3535
Symbol
ID	8666823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3921180
End bp	3923228
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	73%
IMG OID
Product	Beta-galactosidase-like protein
Protein accession	YP_003339214
Protein GI	271965018
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCATCG AGGTCCGCAA CGGTGTCACC ATCGTCGATG GAGAACCCCG GGTGCTCGTC 
ACCGCCGACT ACCCCTACTA CCGGGACGAC CCCGGCGTCT GGGCCGACCG GCTACGGGCG 
ATCCGCGACG AGCTGGGCAT CGAGGTGATC AGCAGCTACA TCCCGTGGCG GCACCACCAG 
CCCGACGCCG CGACGGCGCC CGACTTCACC GGTGACGGCC ACCCCGGCAG GGACGTCGTC 
GGTTTCCTCA ACCTCTGTCA CGATCTCGGG CTGAAGGTCA TCGCCAAGCC CGGCCCGTTC 
ATCCATGCCG AGACCACCTA CGGCGGCCTG CCCGACTGGG TCTGCCCCTC GGCCGACGCG 
GAGATCGAGC CGCTGCTCGA CGCGGCGGGC GCCGCCTCGT GCTGGGCGGA CTCGGCCGCG 
CGCCCGCCGG GCAGGCCGCT CCCCGCCCCG CTGGGGGCGG CGTTCCTGGC CAGGGCCGGC 
AGGTGGCTGG CGGCGGTCGG CAAGGAGGTG CTGGACGCCG CGACCCACCC CGAAGGCCCG 
GTCATCATGA TGCAGATCGC CAACGAGGGC ATCTACACCA ACGGCGCGCG GTCGCTGTCG 
GCCTACGACT ACAGCCCGTC GGGGCTGGCG TTCTTCCGCG ACCGGCTCCA GGGATGGTAC 
GGCTCGATCG AGGAGTACAA CCGCACCCAC GCGACGGCGC ACCGGCGCTG GGACGAGATC 
GAGCCGCCCC GCTCCTGGAC CGGGGCCGAG CGGCCGGAGG AGATGCGGGG CCACGCCGAC 
TGGGGCCGCT TCCACGCCGA ATACCTCACC GAGGTCTACC GGCGCTGGGC CGCCGCGGTG 
GACTGCCGGG TCCCCGTGGT GGTCAACCTG AACCCGCCGA CGGTCGAGGA GCTGGACGGC 
TGGCTGGCCC GGGTGCGCCC CGAGACGTGG GGGGACATCA CCTACGGGTT CACCAACTGG 
ATGGGCGTGG TCTCGGCCGA CCCCGACGCC CAGGCGCGTT ACGTGATCGC CGCCAAGCGG 
GCACCCGGCC CGAACCTAGA GGAGAACTGG GGCTTCTCCC AGCTGTACGA CCCCGCCTAC 
TCCGACGCCG CCACCAGCTT CCACCAGAGC CTGCTGGCCT TGGCCGCCGG ATCCACCGGG 
TTCAACGTCT ACACCGGAGC CGCCACCTCC GGCTGGTCAC CCGACCTGGA CTCCACCCAC 
ACCGCGCCGT ATCCCGACAG CGCCCCGATC GCCGCCGACG GCTCCGCCAC CGCGAAGGCG 
CCCGTCGTCC GCGTGCTGGC GGACTTCTTC GCCCTGCACG GGGTGGAGTT CCTGGAGTGC 
GCGCCGGTCA CGGAAGAGGC CTTCGGGCTG TACCTGCCCT ACGCCGGGAT CGCCGCCTGG 
CCGGGCGCGG AGCGGTTCGG GGCACCCCGG TGCGGTACGG CGCTGCGCGC CTTCCACGAC 
CGCATGCGGC AGGCGGGCCG CGACTACGCC GTGGTCGAGC TGGAGAGCGC CACGCCCGAC 
CGGCTGGCCG CGCACGGGAG GCTGACGGTT CCCGGCGGCC CGTTCATGCA TCGCCACGTC 
CAGGACCTGC TGGCCGGCTA CCTGGCGGGC GGCGGCCGGA TCCTGCTGGA CGGCCCGGCG 
CCCGGCCTCG ACGAGGACCT GCGCCCGTAC GGCGTGCTCG CCGAGGCGCT CGGCCGTACC 
GCGTCCACGC CGGACGCCCC GCAGGCGGAG GCGGGGGCGG TCCGGGTGAC GCGCGGCAGG 
GCGGACGCGT TCCTCCGGGC GCATCCCGGA CGCGACGTCC AGTACCTGAC GGTCCTCGTG 
GACAGCGAGA ACGAGGGGCC CGTCAGGGTG GAGACCGCGT ACGGCGCCTT CGAGACCTCT 
TGCGCGCGGG GCGGCGGGGC CGTGGTGAGG CTGGCCGGGG GCGTGCTGGA CGACTTCGTC 
GTCAAGGGGC TCAACAGCTT CCTCGACTCC GCCGTGCCGG CCCGGATCAG TGTCGGCGAC 
CAGGAGGAGC GGGCGGGCTT ACCCGCCGAC CTGGCCCGGA TCGGCAGGAG GATCCGCCTG 
CTCGGGTAG

Protein sequence

MTIEVRNGVT IVDGEPRVLV TADYPYYRDD PGVWADRLRA IRDELGIEVI SSYIPWRHHQ 
PDAATAPDFT GDGHPGRDVV GFLNLCHDLG LKVIAKPGPF IHAETTYGGL PDWVCPSADA 
EIEPLLDAAG AASCWADSAA RPPGRPLPAP LGAAFLARAG RWLAAVGKEV LDAATHPEGP 
VIMMQIANEG IYTNGARSLS AYDYSPSGLA FFRDRLQGWY GSIEEYNRTH ATAHRRWDEI 
EPPRSWTGAE RPEEMRGHAD WGRFHAEYLT EVYRRWAAAV DCRVPVVVNL NPPTVEELDG 
WLARVRPETW GDITYGFTNW MGVVSADPDA QARYVIAAKR APGPNLEENW GFSQLYDPAY 
SDAATSFHQS LLALAAGSTG FNVYTGAATS GWSPDLDSTH TAPYPDSAPI AADGSATAKA 
PVVRVLADFF ALHGVEFLEC APVTEEAFGL YLPYAGIAAW PGAERFGAPR CGTALRAFHD 
RMRQAGRDYA VVELESATPD RLAAHGRLTV PGGPFMHRHV QDLLAGYLAG GGRILLDGPA 
PGLDEDLRPY GVLAEALGRT ASTPDAPQAE AGAVRVTRGR ADAFLRAHPG RDVQYLTVLV 
DSENEGPVRV ETAYGAFETS CARGGGAVVR LAGGVLDDFV VKGLNSFLDS AVPARISVGD 
QEERAGLPAD LARIGRRIRL LG