Gene Sros_1287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1287
Symbol
ID	8664562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1325836
End bp	1327941
Gene Length	2106 bp
Protein Length	701 aa
Translation table	11
GC content	75%
IMG OID
Product	Beta-galactosidase
Protein accession	YP_003337028
Protein GI	271962832
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.686384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACTGGC CGAGAGGGCT CGAAGGGCTG TGCTACGGCG GGGACTACAA CCCCGAGCAG 
TGGCCGGAGG AGGTCTGGAG GGAGGACGTC GGGCTGATGC GGCGGGCCGG GGTCAACCTG 
GTCACCGTCG GGGTGTTCTC CTGGGCCCGG CTGGAGCCGT CACCCGGCGT CCACGACTTC 
GGCTGGCTGG ACCGGGCCCT CGACCTGCTC CACAAGGGCG GGATCAGGGT CAGCCTGGCC 
ACCCCCACCG CCTCCCCGCC GCCCTGGTTC GGCCTGGCCC ACCCGGACGC GCTCACCGTC 
GCCGCCGACG GGACCCGGCT CACCCACGGC AGCCGCGACA CCTACTGCGT GAGCGCCCCG 
GCCTACCGTG ACGCCGCCGT CCGGATCGCC ACCGGACTCG CCGAGCGCTA CCGCGAGCAC 
CCGGCCCTGG CCATGTGGCA CGTCCACAAC GAGTACGGCA CCTGGTGCCA CTGCGACCAC 
GTCGCCGCCG CCTTCAGGAC CTGGCTCGAA GCCCGTCACG GCACGCTGGA GGCGCTGAAC 
GACGCCTGGA CCACCTCGTT CTGGGGCCAG CACTACTCGG CCTGGGAGCA GGTCCTGCCG 
CCCCGCGCCA CCCAGTACCT CCCCAACCCG TCCCAGACCC TCGACTTCCG GCGGTTCCTG 
TCCGACGCCA TGCTCGACTG CTTCCGCGAG CAGAAGGCGG TGCTGCGCGC GCTCACCCCG 
GACGTCCCGG TCACCACGAA CTTCGTCTTC GGCGGCTGGG TGCCGGTGGA CCAGCGGCGC 
TGGGCCGGGG AGGTGGACCT GGTCGCGATC GACCACTACC CGGCGGCCGA CCCCCCGGCG 
GAGACCGCGT TCGGCGCGGA CCTCGCGCGG CACTGGGCCG GCGGGGCGCC GTGGCTGCTG 
ACGGAGCAGG CGGTGGTGAC CTACACCGGG CCCCGGATGG TCGCCAAGCG GCCCGGGGAG 
ATCGCCAGGC TGAGCCTGTC GCACATCGCG CGGGGCTCGC GGGGCGCGAT GTTCTTCCAG 
TGGCGCGCCT CGCGGGGCGG GGCCGAGCTC TGGCACTCGG GCATGGTGCC GCACGCCGGC 
CCGGACTCGC GGATCTTCCG CGAGGTCTGC GAGCTGGGCG CGCTCCTGCC CGCCCTCGAA 
GAGGCCACCC GGGCGCCGGT CGAGGCGGAG GCGGCGGTCC TGTGGAACGT CGAGGCGGGG 
TGGGCGCTGC AGTCGCCGGG CCTGCCGTCC ACGGAGCTGA GCTACCTGGA CGCGGTACGG 
CAGGCGCACC GGGTGCTCTA CCGGCACGGC GTCACCGCCG ACTTCGCCCA TCCGTCCGAC 
GATCTCTCGG CATACAGGTT CGTGCTCGTC CCCAGCCTCT ACCTGATCTC CGACGCCGAC 
GCGGAGAACC TGCGCCGCTA CGTCGAGGGC GGCGGCACGC TCGTGGCCTC CTTCCTCAGT 
GGGGTCGCCG ACGAGCACGC CCGCGTCCGG ACGGGCGGCT ACCCCGGGGC CCTGCGCGAC 
CTGCTCGGCA TCCGGGTCGA GGAGTTCCAC CCGCTGCCCC CGGACGCCGC GATCCCGCTG 
TCCACCCCCG GCGGCGGCCC CCTCGGCGCC GGCATCCTCC CGCTCGCCCG GGAGGGCGCC 
GACCCGCCGC CGGGCGAGCG GGCTCCGCAC GACACCGGGA CCTTCTGGAG CGAGCACGTC 
CACCTGGAGG GCGCCGAGGC GCTGGCCCTC TACGCCGTGC CGGAAGCCCC CGCCCTGGAC 
ACCCCCGCCC TGGACTCCCC CGCCCCGGAC ACCCCCACCC CGCACGCGCC CGGCCCGCAC 
GCGCCCGGCC CGCACGCGCT CAGGACGGAC GCTCCCGGGA CGGGTGCGCC GGGCGCCGCG 
CTCGCCGGCC TGCCGGCGAT CACCCGCCAC CGGCACGGCC GGGGGACGGC CCTCTACCTG 
TCCACCCGGC TCACCGACGG CGCCTACGCC CGCCTGCTGG GCCTGCGGCC CGCTCCCGTG 
GAGCGCGTGC GGCGGGGCGG GTGGCTGTTC ACGATCAACC ACGGCGACGA GGAGCAGGAG 
GGAACCGGCG GCCTGCGGTT ATCCCCCGGC GGTTACGCTG TACAAAAGGT GCAAGCAGGC 
GTCTAG

Protein sequence

MDWPRGLEGL CYGGDYNPEQ WPEEVWREDV GLMRRAGVNL VTVGVFSWAR LEPSPGVHDF 
GWLDRALDLL HKGGIRVSLA TPTASPPPWF GLAHPDALTV AADGTRLTHG SRDTYCVSAP 
AYRDAAVRIA TGLAERYREH PALAMWHVHN EYGTWCHCDH VAAAFRTWLE ARHGTLEALN 
DAWTTSFWGQ HYSAWEQVLP PRATQYLPNP SQTLDFRRFL SDAMLDCFRE QKAVLRALTP 
DVPVTTNFVF GGWVPVDQRR WAGEVDLVAI DHYPAADPPA ETAFGADLAR HWAGGAPWLL 
TEQAVVTYTG PRMVAKRPGE IARLSLSHIA RGSRGAMFFQ WRASRGGAEL WHSGMVPHAG 
PDSRIFREVC ELGALLPALE EATRAPVEAE AAVLWNVEAG WALQSPGLPS TELSYLDAVR 
QAHRVLYRHG VTADFAHPSD DLSAYRFVLV PSLYLISDAD AENLRRYVEG GGTLVASFLS 
GVADEHARVR TGGYPGALRD LLGIRVEEFH PLPPDAAIPL STPGGGPLGA GILPLAREGA 
DPPPGERAPH DTGTFWSEHV HLEGAEALAL YAVPEAPALD TPALDSPAPD TPTPHAPGPH 
APGPHALRTD APGTGAPGAA LAGLPAITRH RHGRGTALYL STRLTDGAYA RLLGLRPAPV 
ERVRRGGWLF TINHGDEEQE GTGGLRLSPG GYAVQKVQAG V