Gene Sros_3342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3342
Symbol
ID	8666630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3658619
End bp	3660235
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	72%
IMG OID
Product	conserved hypothetical protein; K01187 alpha- glucosidase
Protein accession	YP_003339024
Protein GI	271964828
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.292623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0532512
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC TCGTCCACGC GGACCATGCC AGCGAGACCG CCACCCGGTG GTGGCGCGAC 
GCGGTGATCT ACCAGGTCTA CGTGCGCAGC TTCGCCGACG GCAACGGTGA CGGGATCGGC 
GACCTGCTGG GCGTGCGGAG CCGGCTGCGG TATCTGGCCG ATCTGGGGGT CGACGCCATC 
TGGCTGACCC CGTTCTACAC CTCGCCGATG GCCGACTTCG GCTACGACGT GGCGGACTAC 
CGGGACGTCG ACCCCATCTT CGGGTCGCTG GGCGACGCCA GGGCCCTGAT CGACGACGCG 
CACCGGCACG GCCTGCGGGT GATCGTCGAC GTCGTGCCCA ACCACACCTC CGACCGGCAC 
GTGTGGTTCC AGCAGGCCCT GGCCGCCGGG CCCGGCAGCC CCGAGCGGGA GCGTTACATC 
TTCCGCCAGG GCAAGGGGGA GAACGGGGAG CTGCCCCCGA ACGACTGGGA GTCGGTCTTC 
GGCGGCCCCG CCTGGACCAG GTTGCCCGAC GGCGAGTGGT ACCTGCGCCT GTTCGCCCCC 
GAACAGCCCG ACCTGAACTG GGACAACCCC GAGGTTCACG CGGAGTTCGA GTCGGTCCTG 
CGCTTCTGGC TCGACCTGGG CGTGGACGGC TTCCGCGTCG ACGTGGCGCA CGGCATGGTC 
AAGGCCGACG GCCTGCCCGA CGTCGGCCAC CCCGACCAGG TCCGGATGAT CGGTTCCGAC 
GTGGTCCCGT TCTTCGACCA GGACGGCGTG CACGAGATCC ACCGCGGCTG GCGCAGGCTG 
CTCGACTCCT ACCCGGGCGA GAGGATCGGC GTCGCCGAGG CGTGGGCGCC GTCCCCGCAG 
CGGCTGGCCA ACTACGTCCG CCCGGACGAG CTGCACCAGG CGTTCAACTT CCACTTCCTG 
AACACCCCGT GGGACGCGGC CGGGTTCCGC ACGGTGATCC AGGAGTCGCT CGCCACGGCC 
GGACTGGTCG GCGCGCCCAG CACCTGGGTG CTGTCCAACC ACGACGTCAA GCGGCACCTG 
ACCCGCTACG GCGGCGGCGA GATCGGCCTG CGCCGCTCCC GCGCCGCGGC CCTGCTGACG 
CTCTCCCTGC CCGGCTCGAC CTACGTCTAC CAGGGCGAGG AGCTCGGGCT GCCGGAGGTC 
CTCGACCTGC CGGAGGAGTT CCTGCGCGAC CCGCAGCGGC TGCGCAACCC CGACGACGGC 
CGCGACGGCT GCCGGGTCCC CATCCCGTGG GCCGACGTCG AGCCGCACTT CGGCTTCAGC 
CTGCCAGGCA TCGAGGAGTC ATGGCTGCCC ATGCCCGCCT CCTGGGGACC GCTCAGCGTC 
CAGTCCCAGC TGCGCGACCC GCTCTCCACG CTGCACCTCT ACCGGACGGC GCTGGAGATC 
AGGCGGGACC GCCGCTCCTT CGGCGACGCG CCGCTGACCT GGCTGGACTC ACCCGAGGGC 
ACGCTGGCCT TCACCCGGGG CGACGGCTTC GCCTGCACGC TCAACCTGAC CGGCGAGCCG 
GTCGAGCTGC CCGCGCCCGG ACGGGTCCTG CTGGCCAGCG AGGAACCGGT CGTCGACGGC 
GACACGGTAC GGCTCGCCCC CGACTCCGCG GTCTGGTGGG AACGCGATGC CGTATAG

Protein sequence

MTELVHADHA SETATRWWRD AVIYQVYVRS FADGNGDGIG DLLGVRSRLR YLADLGVDAI 
WLTPFYTSPM ADFGYDVADY RDVDPIFGSL GDARALIDDA HRHGLRVIVD VVPNHTSDRH 
VWFQQALAAG PGSPERERYI FRQGKGENGE LPPNDWESVF GGPAWTRLPD GEWYLRLFAP 
EQPDLNWDNP EVHAEFESVL RFWLDLGVDG FRVDVAHGMV KADGLPDVGH PDQVRMIGSD 
VVPFFDQDGV HEIHRGWRRL LDSYPGERIG VAEAWAPSPQ RLANYVRPDE LHQAFNFHFL 
NTPWDAAGFR TVIQESLATA GLVGAPSTWV LSNHDVKRHL TRYGGGEIGL RRSRAAALLT 
LSLPGSTYVY QGEELGLPEV LDLPEEFLRD PQRLRNPDDG RDGCRVPIPW ADVEPHFGFS 
LPGIEESWLP MPASWGPLSV QSQLRDPLST LHLYRTALEI RRDRRSFGDA PLTWLDSPEG 
TLAFTRGDGF ACTLNLTGEP VELPAPGRVL LASEEPVVDG DTVRLAPDSA VWWERDAV