Gene Sros_5497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5497
Symbol
ID	8668791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6016073
End bp	6017731
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	68%
IMG OID
Product	Catalase
Protein accession	YP_003340996
Protein GI	271966800
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0993453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0454978
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACG TGTCGAGCAG GGGACAGCAG CCGGGTGACG AGCGGCCGGT GCTGACCAAC 
CGGCAGGGGC ACCAGGTCTA CGACAACCAG AACCAGCGTA CGGTCGGCGC GCGAGGCCCG 
GCCACGCTGG AGAACTACCA GTTCCTGGAG AAGATCAGCC ACTTCGACCG GGAGCGGATC 
CCCGAGCGGG TGGTGCACGC CCGCGGGGCG ACGTCCTACG GGTACTTCGA GGCCTACGGC 
AAGCTGGGTG ACGAGCCGAT CGCCCGCTAC ACCAGGGCGA AGCTGTTCCA GGAGGCGGGC 
AAGCGGACCG ACCTGGCCAT ACGCTTCTCG ACCGTGATCG GCGGCAGGGA CTCCTCCGAG 
GCGGCGCGCG ACCCCCGCGG GTTCGCGGTG AAGTTCTACA CCGAGGACGG CAACTGGGAC 
CTCGTCGGCA ACAACCTGGC CGTCTTCTTC ATCAGGGACG CCATCAAGTT CCCCGACGTG 
ATCCACGCGC TCAAGCCCGA CCCGGTGACC TTCCGGCAGG AGCCCAACCG GATCTTCGAC 
TTCATGTCGC AGACGCCGGA GAGCATGCAC ATGCTGGTCA ACCTGTTCAG CCCGCGCGGC 
ATCCCCGCCG ACTACCGCCA CATGCAGGGA TTCGGCGTCA ACACCTACAA GTGGGTGAAC 
CAGGAGGGTG AGACGCACCT GGTGAAATAC CACTGGATGC CCAAGCAGGG CGTGCGGAGC 
ATGACCGCCG CCGACGCGGC CGCCGTACAG GGCCAGGAGC TGGGGCACGC CACCAAGGAC 
CTGCGTGAGG CGATCGACCG CGGGGAGTTC CCCGAGTGGG AGCTCCTGGT GCAGATCATG 
ACGGACGAGG AGCACCCCGA GCTGGACTTC GACCCGCTGG ACGACACCAA GGTGTGGCCG 
GAGAACGAGT TCCCCGCGCT GCCGGTCGGC CGGATGGTCC TGGACCGGAA CGTGGCCAAC 
AACTTCGCCG AGAACGAGCA GATCTCCTTC GGCACCGGCG TCCTGGTCGA CGGGCTCGAC 
TTCTCCGACG ACAAGATGCT GGTGGGCCGG ACGTTCTCCT ACAGCGACAC CCAGCGCCAC 
CGGGTGGGGC CCAACTACCT GCAGCTCCCG GTCAACCAGG CCAAGCACGC CGAGGTGCGC 
ACCAACCAGC GCGACGGCCA GATGACCTAC CACGTCGACG ACCAGGGGGA GAGCCCGCAC 
ATCAACTACG AGCCGTCCCT GATCGGGGGG CTGCGCGAGG GGCACTACCC CACCCACGAC 
GAGCAGGGGC CGGTCCTCTC CGGGCGCCTG ACCCGCAAGC GCATCCCGAG GACCGACGAC 
TACACCCAGG CCGGCCAGCG CTACCTGCTG ATGGAGCAGT GGGAACGCGA CGACCTCGTG 
CTCAACCTCG TCACCCTCCT GTCCCAGGCC GAGCGCCCCG TCCAGGAGCG CATGGTCTGG 
CACTTCCTGA TGGCCGAGGA CGAGCTCGGG CTGCGGGTCG GGGAGGGGCT CGGGATCGGC 
CCGGAGGACG TCGCCCACCT CGAACCGCTG GCGAGCCAGG AGCTGGACGA CAAGGAGCGT 
GAGCGGCTGT CCAACCTGGG GAAGAACGGG CCGCGCGACG TGACCGGCCT GAAGATGACC 
CACTGCGTCC CCGACGAGCG GGCGCAGCCG GCCGCGTGA

Protein sequence

MTDVSSRGQQ PGDERPVLTN RQGHQVYDNQ NQRTVGARGP ATLENYQFLE KISHFDRERI 
PERVVHARGA TSYGYFEAYG KLGDEPIARY TRAKLFQEAG KRTDLAIRFS TVIGGRDSSE 
AARDPRGFAV KFYTEDGNWD LVGNNLAVFF IRDAIKFPDV IHALKPDPVT FRQEPNRIFD 
FMSQTPESMH MLVNLFSPRG IPADYRHMQG FGVNTYKWVN QEGETHLVKY HWMPKQGVRS 
MTAADAAAVQ GQELGHATKD LREAIDRGEF PEWELLVQIM TDEEHPELDF DPLDDTKVWP 
ENEFPALPVG RMVLDRNVAN NFAENEQISF GTGVLVDGLD FSDDKMLVGR TFSYSDTQRH 
RVGPNYLQLP VNQAKHAEVR TNQRDGQMTY HVDDQGESPH INYEPSLIGG LREGHYPTHD 
EQGPVLSGRL TRKRIPRTDD YTQAGQRYLL MEQWERDDLV LNLVTLLSQA ERPVQERMVW 
HFLMAEDELG LRVGEGLGIG PEDVAHLEPL ASQELDDKER ERLSNLGKNG PRDVTGLKMT 
HCVPDERAQP AA