Gene Sros_3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3398
Symbol
ID	8666686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3738599
End bp	3739825
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	74%
IMG OID
Product	Dyp-type peroxidase
Protein accession	YP_003339078
Protein GI	271964882
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.528141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.50105
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGACC CCCGCTTGAC TCGCAGGGGA CTCCTCGCGG GAGGCGCCGC CGCAGCGGCC 
GGCGCCCTCG CGGGGTGCGC CCCCGGGCAG GTCGCCCTCT CCGGGCCGGC CGTCCCCCCC 
ACCACGCCGG AAACGGCTCC CCCGATCTCC GGCGCCTCGG CGACGGAGCC CTTCCACGGC 
CCCCACCAGG CCGGGATCGC CACCACCCCC CAGACCCACG CGGTGTTCGT CGGCCTGGAC 
CTGCTGCCCG GCACCGGCCG CGAAGCCGTC GTCCGGATGA TGCGCCTGCT CACCGACGAC 
GCCCGCCGCC TGAGCGAGGG CCGCCCCGCC CTGGCCGACA CCGAGCCGGA ACTGGCCGCG 
CCCCCCGCCC GGCTGACCGT CACCTTCGGC TTCGGTCCCG GCCTGTTCGC CGCGGCCGGA 
GTCCAGGACC GGCGGCCCGG GTCGATCGCG CCCCTGCCCG GGTTCGTGGT CGACAAGCTG 
GAGAAGCGGT GGACAGGCGC GGACCTGCTG CTGCAGCTCT GCGCCGACGA CCCCGTCACC 
CTCGCCCACG CCCTGCGCAT GACGATCAAG GACGCCCGCT CCTTCGCCCG GGTGCGCTGG 
ACCCAGCGGG GGTTCCGCCG CAGCCCGCAG GCCGCGGCCC CCGGCACGAC CCAGCGCAAC 
CTCATGGGCC AGCTGGACGG GACCGTCAAC CCCCAGCCGG GCACGCCGGA CTTCGACCGG 
GCCGTCTGGG TCGGCGACGG CCCGCGGTGG CTGCATGGCG GCACCACCCT GGTGCTGCGG 
CGCATCCGCC TCAAGCTGGA GACCTGGGAC GCCGCCGACC GGGTGGCCAA GGAGTTCACC 
ATCGGCCGCC GCCTGGACAC CGGCGCCCCG CTGACCGGGC AGAAGGAGCG CGACGAGCCC 
GACTTCGACA AGCTCAACGC GGTCGGCTTC CCGGTCATCT CCGAATACGC CCACATCCGC 
CGGGCCCACG TCACCGACCC GGGCATGCGG ATCCTGCGCC GGGTCTACAA CTACGACGAG 
GGCCTCACCC CCGAGGGACA CGCCGACTCC GGACTGCTGT TCGCCTCCTA CCAGGCCGAC 
ATCGACCGCC AGTTCGTCCC CATCCAGAAG AGACTGGCCG AGGCCGACCT GCTCAACGAG 
TGGACGACCC CCATCGGCTC GGCGGTCTTC GCCATCCCTC CCGGATGCGC ACGCGGCGGA 
TGGGTAGGAG AGACCCTCCT GTCCTGA

Protein sequence

MPDPRLTRRG LLAGGAAAAA GALAGCAPGQ VALSGPAVPP TTPETAPPIS GASATEPFHG 
PHQAGIATTP QTHAVFVGLD LLPGTGREAV VRMMRLLTDD ARRLSEGRPA LADTEPELAA 
PPARLTVTFG FGPGLFAAAG VQDRRPGSIA PLPGFVVDKL EKRWTGADLL LQLCADDPVT 
LAHALRMTIK DARSFARVRW TQRGFRRSPQ AAAPGTTQRN LMGQLDGTVN PQPGTPDFDR 
AVWVGDGPRW LHGGTTLVLR RIRLKLETWD AADRVAKEFT IGRRLDTGAP LTGQKERDEP 
DFDKLNAVGF PVISEYAHIR RAHVTDPGMR ILRRVYNYDE GLTPEGHADS GLLFASYQAD 
IDRQFVPIQK RLAEADLLNE WTTPIGSAVF AIPPGCARGG WVGETLLS