Gene Sros_0115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0115
Symbol
ID	8663379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	116463
End bp	117788
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	71%
IMG OID
Product	Phosphoprotein phosphatase
Protein accession	YP_003335913
Protein GI	271961717
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.11266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG CACTCCGTTA CGCCGCCCGC TCTGACGTCG GCCTCCTCCG CGAAGGTAAC 
GAGGACTCGG CGTACGCCAG CGGTCGTCTG CTCGCCGTCG CCGACGGTAT GGGCGGCCAC 
GCACACGGTG AGGTGGCCAG CTCGGTCGCC ATCGCCGCGA TGTCCTCCCT CGACGAGGAC 
CCGCAGGGGG GTGACCTGCT CAGCGCCGTC GAGGCGGCGG TCAGAGACGC CAACCGCAGG 
CTCCACGAGA TGGTGGGACG GGACCCGAGC CTCAAGGGCA TGGGCACCAC CCTGACCGCC 
ATGCTGTGGT CGGGCACGAG GGTCGCGCTG GTCCACGTCG GCGACTCCCG CGCCTATCTG 
CTGCGCGCCG GGGAGCTCTA CCAGATCACG CACGACCACA CCCTGGTGCA GTCCCTGGTG 
GACGACGGCC GGATCACCCT GGAGGAGGCC GCCACCCACC CGCAGCGGTC GATCCTGCTG 
CGCGCCCTCG ACGGCAGCGG CGAGGTCGAC CCCGACCTGT CGCTGCGCGA GGCCCAGGTC 
GGCGACCGCT ACCTGCTCTG CTCCGACGGG CTGTCCGGCG TGGTGAGCGC GGAGACGATG 
CACCACACGC TCTCCACGAT CGAGGACCCC GAGACGGTGG TCCGCACGCT CATCGACCTG 
GCCAACCGCG GCGGCGGCCC CGACAACATC ACCTGCGTGC TCGCCGACGT CCTGGAGGTG 
GACGAGGGTC TCGCCCTCCC CGTCGAGGCC GCCGTGGTGG GCGCCGCCGG GTCCACCCGG 
CCGCGGACCC AGCTCCCGGA CACCCCGGCG GGCCACGCCG CGGGGATCAC CATGCCCCAG 
CCCGTCATCA CGGACGACGA TCTCGAGGAG CCGGTCGCCA GGGCCACGGG GCGGCCGGCC 
AGGCGCCGTC GACTGTGGCC GCTCATGGCC TCGGTGGGAG GCGTCGTCCT GGTCGGCGGC 
GGCCTAGGGT GGTACTTCGG GAGCCAGTGG CTCGACGACC AGTACTTCGT AGGGGTGAAA 
GGGGATGAGA TCGTGGTTTT CCAGGGCGTG AAGACCAACC TCGGCCCCAT CGAGCTCTTC 
GACGTCGCCC GGAGCACCAC CGAGTCGGTC ACGGCCCTTG GCGCGTTCCA GCAGGGCCAG 
GTCCGCGACG GCATCCCCGT CGCCAGCGTC GACGAGGGCC TGAAGAAGAT CGAGGAGCTC 
AAGACGTCCG CGGCGAAGCC CGCGACGAAA CCGACGGCGA AGCCCGAGTC CAAGCCTGAC 
GGGAAGGGCA AGCAGACCTC CCAGCCGAGC GGCACCGCAT CCCCGGAACC CACAAGGTCG 
CAGTAG

Protein sequence

MTIALRYAAR SDVGLLREGN EDSAYASGRL LAVADGMGGH AHGEVASSVA IAAMSSLDED 
PQGGDLLSAV EAAVRDANRR LHEMVGRDPS LKGMGTTLTA MLWSGTRVAL VHVGDSRAYL 
LRAGELYQIT HDHTLVQSLV DDGRITLEEA ATHPQRSILL RALDGSGEVD PDLSLREAQV 
GDRYLLCSDG LSGVVSAETM HHTLSTIEDP ETVVRTLIDL ANRGGGPDNI TCVLADVLEV 
DEGLALPVEA AVVGAAGSTR PRTQLPDTPA GHAAGITMPQ PVITDDDLEE PVARATGRPA 
RRRRLWPLMA SVGGVVLVGG GLGWYFGSQW LDDQYFVGVK GDEIVVFQGV KTNLGPIELF 
DVARSTTESV TALGAFQQGQ VRDGIPVASV DEGLKKIEEL KTSAAKPATK PTAKPESKPD 
GKGKQTSQPS GTASPEPTRS Q