Gene Sros_4474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4474
Symbol
ID	8667768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4987198
End bp	4988331
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	72%
IMG OID
Product	salicylate hydroxylase protein
Protein accession	YP_003340084
Protein GI	271965888
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.102807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCA CTCCGACACC CCGCATCGCC ATCATCGGGG CCGGTCCCGG CGGCCTGATC 
TGCGCTCGCA TCCTCCAGCA GCACGGCATC ACCGCCGCCG TCTACGACCG CGACGCCGGC 
CCCGCCGCCC GCGACCAGGG CGGCACTCTC GACCTGCACG CCGACAACGG CCAGATCGCT 
CTGCGCGAAG CCGGCCTCCT GGAGGAGTTC TTCCGACTGG CCCGGCCCGA GGGCCAGGAG 
ATGCGCCAGA TGGACCCGGC CGGCACGATC CTCTTCCACC ACGTCCCCGA GCAGGGCGAG 
CGGTTCAAAC CGGAAATCGA CCGCGGCAGG CTGCGCGACC TGCTGCTCGA CTCGCTTCAG 
CCCGGCACCG TGCGCTGGGG CCATGCCCTG CAGACCGTCA GCGGCCCCGC CGAAGGCCCC 
CGGCAGCTGC ACTTCACGGG CGGCACCACC ATCGAAGCCG ACCTCGTCGT CGGCGCCGAC 
GGCGCCTGGT CCAAGGTCCG CCGCGCCCTC TCCCAGGCCA CCCCCCGCTA CAGCGGCGTA 
AGCTTCCTGG AAGCCTGGTT CCACGATGTC GCGACCCGGC ACCCCGACAT CGCCGAGCTC 
GTCGGCCAGG GCGGCGCCGC CGCAGCCGAC GGCGACCGCG GCCTGTTCGC CCAGCGCAAC 
AGCGGCGACC ACATCCGCGT CTACATCATC CAGCGCGTCC CGGCCGACTG GATCACCGCC 
GGCGGTCTCA CCCCCCAGGC CACCGACGGC ATCCGCGCCC TCCTCCTGGA GCGCTACCGC 
GACTGGTCGC CCCGCCTGCG CCGGCTGATC AGCGACAACG ACGGCCCCTA CGTCGACCGC 
CCGATCTTCG CCCTGCCCGT CCCGCACGCC TGGGAGCACA ACCCCACGGT GACCCTGCTC 
GGCGACGCCG CCCACCTCAT GCCCCCGCTC GGCGTCGGCG TCAACCTCGC CATGCTGGAC 
GCATGCGAAC TCGCCCTCGC CATCGCCTGC CACGACACCA TCGACGAAGC CATCCACGCC 
TACGAGGAGA CCATGCTTCC CCGCTCCACG GAGATGGCCC AGCTCCTCGA CGGCGCCGCC 
GGCGAGCTGC TGTCCACCGA GCTGCCCGAC TTCGCCACCG CCGGCAACCA CTGA

Protein sequence

MNTTPTPRIA IIGAGPGGLI CARILQQHGI TAAVYDRDAG PAARDQGGTL DLHADNGQIA 
LREAGLLEEF FRLARPEGQE MRQMDPAGTI LFHHVPEQGE RFKPEIDRGR LRDLLLDSLQ 
PGTVRWGHAL QTVSGPAEGP RQLHFTGGTT IEADLVVGAD GAWSKVRRAL SQATPRYSGV 
SFLEAWFHDV ATRHPDIAEL VGQGGAAAAD GDRGLFAQRN SGDHIRVYII QRVPADWITA 
GGLTPQATDG IRALLLERYR DWSPRLRRLI SDNDGPYVDR PIFALPVPHA WEHNPTVTLL 
GDAAHLMPPL GVGVNLAMLD ACELALAIAC HDTIDEAIHA YEETMLPRST EMAQLLDGAA 
GELLSTELPD FATAGNH