Gene Sros_4537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4537
Symbol
ID	8667831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5054939
End bp	5056174
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	76%
IMG OID
Product	carotenoid oxygenase
Protein accession	YP_003340145
Protein GI	271965949
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.368379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCA CGGAGCACGT CGACCCGATC ATGGCGCTCA TGTCCGCGGC GCCCCGCCGC 
CACCGGACGC ACGACGAGCC GCTGCCGGTC GACGGCGTCA TACCTTCCGG CCTGGACGGC 
GCGTTCGTGC AGGCGAGCAC GTATCCCGGG GGATCGTGGC AGTCGCACGC CACGGCCGGC 
CCCGTCCTCT TCTCCGGCGT ACGGCTCGGC GGCGGCACCG CTCGGCGCCT CACGACGGCC 
GGGGAGTTCG GCGGCCACCC GCTGGAGCGG ATGCCGGACC TCGCGACCTG GATCCGGCCC 
GCCGGATCCG CCGCCCGGCC GCCGGACGGG CCGTGGAGCG CGAGCCTCGC GCCGCCGGTC 
CAGGACCGGG CCACGGCCGA ATGGCACACG ATCGCCACCT ATCCCGGTCT GGGCTGCGCG 
GAGCACCTGA CCCTCGGGAC GGACGGCGGC ATCCGCGACG CCCGGCCCTT CGCCCTCGAC 
GGTGCACCGC TCATGCACGC GGTCGCGCTC ACCGAACGGT TCGTCGTGGT GTTCGACCTG 
CCCGTGACCT ATCACCGGGC GGCGGCGATG GTCGGCACCC GATTCCCCTA CCGCTGGCGG 
CGGGACCGGC CGGCGCGCAT CGGACTGCTG TCACGGCGGC CCGGCGACGC GACGGAACCC 
CGCTGGTTCC CGATCGACCC CTGCTACGTG TCCCATTCGG TCAACGCCTA CGACGACGGC 
GGCCGCGTCG TCGTGGACGC CGTCCGCCAC GAGCGGGCCT TCGACGCTCC GTCGTGGGAC 
GGCGAGGACG GCGCCGGGGC GCCGCGGGTG CACCGGTGGA CGCTCGACCT GGGGAGCGGC 
GCGGCGGAGG AGCGGCCGCT GGTCGACTCC ATGACGCTGG CGTCGGTCGA CTCCCGGCGG 
GCCGGCCGCA GGCATCAGCT GATGTTCGGC CGCACCCCCG GCGGGCGGGC GCTGGTCGGC 
CACGACCTCG CGGCCGGCAG CACGCAGGTG CGGGAGCTCG CCCCGGGCCT GCGCGCCGGC 
CAGCCGGTCT TCGTCCCCCG TGGCCGCGCC GAGGGAGACG GCTGGCTCGT GGTCCTCACG 
CAGGACGGCG CGCGGCGGCG GAGCGAGCTG CTCGTGCTCG ACGCGCTCCA CCTGAACGGC 
CGGCCCCAGG CGGTGGTCCA CCTCCCGGCC CTCCTGCCGG ACGCGCGGCA CACCACCTGG 
ATGACCACAC CCGCCGGGCG TGCGCACCGG CGGTGA

Protein sequence

MTVTEHVDPI MALMSAAPRR HRTHDEPLPV DGVIPSGLDG AFVQASTYPG GSWQSHATAG 
PVLFSGVRLG GGTARRLTTA GEFGGHPLER MPDLATWIRP AGSAARPPDG PWSASLAPPV 
QDRATAEWHT IATYPGLGCA EHLTLGTDGG IRDARPFALD GAPLMHAVAL TERFVVVFDL 
PVTYHRAAAM VGTRFPYRWR RDRPARIGLL SRRPGDATEP RWFPIDPCYV SHSVNAYDDG 
GRVVVDAVRH ERAFDAPSWD GEDGAGAPRV HRWTLDLGSG AAEERPLVDS MTLASVDSRR 
AGRRHQLMFG RTPGGRALVG HDLAAGSTQV RELAPGLRAG QPVFVPRGRA EGDGWLVVLT 
QDGARRRSEL LVLDALHLNG RPQAVVHLPA LLPDARHTTW MTTPAGRAHR R