Gene Sros_5236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5236
Symbol
ID	8668530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5751861
End bp	5753060
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	68%
IMG OID
Product	cytochrome P450 CYP109C2
Protein accession	YP_003340748
Protein GI	271966552
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.134393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA TCGTCGAGCG GTACAACATC CCCGCACAGC ACTTCTGGCT GCATGGGCCG 
CGATCGCGCC AACCGGTCGA GTACGACGCC GACGCCGGCA TGTGGAACGT CTACGGCCAC 
CCCGAACTGC AGGAGATCCT CGGCGATCCC GCGACGTTCT CCTCCGACAC CATGCGCCTG 
ATCCCCAAGG ACCTGATGCC GGGCATCGAG GAATTCTCGA TGGCCGGCTT CATCACCCAG 
ATCGACCCGC CGGAGCACGG CAAGCTGCGC AAGCTGGTCA GCAACGCCTT CACCCGGAAG 
GTCGTCGCGG ATCTCGAACC GAGGATCGCC GCCCTCACCC ACGAACTGCT CGACGCGGCA 
CACGATCGCG GCCGGTTGGA ACTGGTGACC GATCTGGCCT ATCCGCTCCC GGTCATCGTC 
ATCGCCGAAC TGCTGGGGGT GCCCAGCAGC GATCGCGCCC TGTTCAAACA ATGGGCCGAT 
GCGCTGTTCC AGCGCGACGC CAAGATCTCA CTGGCCAAAC CCGCCGAACA ACAGGACGTG 
GACCTGCAGG CCACGCTGAA GCCGTGGAAG GAGATGTCGG CCTATCTCGC CGGCCACGCC 
GCGGAGCGCA GGCGACAGCC GCGCGCCGAC CTGCTCACCA GGCTGGTCGA GGCCGAGGTG 
GACGGCGAAC GCCTGCCCGA CGAGGAGGTG GTCAACTTCG CGATCATCCT GCTGCTCGCC 
GGGCACATCA CCACGACGAT GCTGCTCGGC AACACGGTGC TGTGCCTGGA CGCCTTCCCC 
GAGCAGCAGG ACAAGGTGCG GGCCGACCGA TCCTCGATCC CGGCCGTCAT CGAGGAATCC 
CTGCGCCTGT TCACCCCGTT CGCCGCCCTC GGCCGCGCCA CCACCCGCGA CGTCGAGCTC 
GGCGGCGTGA CGATACCGGC CGATCACATG GTCATGGCCT GGCTCGGAGC GGCCAACAGG 
GACCCCCGGC AGTTCCCCGA CCCCGACGTC TTCGACCCCG GTCGCGACCC CAACCCGCAT 
CTCGGGTTCG GCCGCGGCAT CCACTTCTGC CTAGGCGCCC CCTTGGCCCG GCTGGAGGGA 
CGGGTCGCCC TGAACATCCT GCTCGACCGC GTCGACCCTC TGCGCACCGA TCCGGACGAC 
CCCGTGGAGT TCATGCCCAC GCCGACCATG ACAGGGGTGC GCCGCCTCCC GTTGATCTGA

Protein sequence

MADIVERYNI PAQHFWLHGP RSRQPVEYDA DAGMWNVYGH PELQEILGDP ATFSSDTMRL 
IPKDLMPGIE EFSMAGFITQ IDPPEHGKLR KLVSNAFTRK VVADLEPRIA ALTHELLDAA 
HDRGRLELVT DLAYPLPVIV IAELLGVPSS DRALFKQWAD ALFQRDAKIS LAKPAEQQDV 
DLQATLKPWK EMSAYLAGHA AERRRQPRAD LLTRLVEAEV DGERLPDEEV VNFAIILLLA 
GHITTTMLLG NTVLCLDAFP EQQDKVRADR SSIPAVIEES LRLFTPFAAL GRATTRDVEL 
GGVTIPADHM VMAWLGAANR DPRQFPDPDV FDPGRDPNPH LGFGRGIHFC LGAPLARLEG 
RVALNILLDR VDPLRTDPDD PVEFMPTPTM TGVRRLPLI