Gene Sros_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3157
Symbol
ID	8666445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3438059
End bp	3439264
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	71%
IMG OID
Product	putative cytochrome P450
Protein accession	YP_003338846
Protein GI	271964650
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.192743
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGT CCACGGCTCC CGCGCCGCTC CCGGCCGCCC GTAAGGCGGG CTGTCCCTTC 
GACCCCCCGG AGGATCTCGC GCGGCTGCGC AGGGACCATC CGATCAGCCC CATGGCGTAC 
CCCGACGGCC ACATCGGCTG GCTCGTCACC AGCCATGCCC TGGTGCGCGC CGTCCTCGCC 
GACCCCCGCT TCAGCCACAG GGCCGACCTC ACCCACAGTC CCCTGAGCGG GGCGCGCACG 
GGCGCCCCCC GGCCGGCGCC GCCGGGGATC TTCACCTCGA TGGACCCGCC CGAGCACACC 
CGCTACCGGC GCCTGCTCAC CGGCCAGTTC ACCGTCCGCA GGATGCGCCG GCTGACCGGG 
AGGATCCATG AGATCACCGC CGAACACCTG GACGCGATGG AACGGCAGGG GCCGCCCGTC 
GACCTCATGG AGGCGTTCGC GCTGCCCATC CCCAGCTTGG TCATCTGCGA GCTGCTCGGC 
GTGCCCACCA CCGAACGCGC CGGATTCCAG AGCGACATGT CCAAGCTGAT GAGCCTGGAG 
GTCTCCACGG ACGAGAAGAT CGCCGCCTTC GGCACGCTCC AGGCGTTCAT GCTCGACCTG 
GTGCTCGCCA AGCGCGCCGA GCCCGCCGAC GACCTGCTCA GCGGCCTGGT CACCGGCACC 
GACCTGACCG ACGAGGAACT GACCAACATC GGCGGTGTCC TGATGGGCGC GGGCTTCGAG 
ACCACCGCGA ACATGCTCTC CCTCGGCGCC TACGCCCTCT TGGGCCATCC GGAGCAGCTC 
GCCGCGCTCC GCGCGGACAC GGGCCTCACC GACAAGGCCG TCGAGGAGCT CCTGCGCTAC 
CTGAGCATCA TTCCCGGCAC CGTCAGGGCC GCGCTCGAGG ACGTCGAGCT CGGCGGGCAG 
CTCGTCAGGG CAGGTCAGTC GGTCATGGTC TCCATCCCCG CCGCCAACCG CGACCCCGAG 
CACTTCGCCG ACCCCGACAC GCTGGACCTC CACCGGCCCA CCGCGGGACA CGTGGCCTTC 
GGCCACGGCA TCCACCAGTG CCTCGGCCAG CAGCTGGCAC GCGTCGAGAT GCAGGTCGGC 
ATCCCCGCGC TGTTCGCCAG GTTCCCGACG CTGCGCCTGG CCGTCCCGCC CGATGAGGTG 
CCCCTGCGCA CCGACATGAT GATCTACGGC GTGCACCGGC TTCCCGTCAC CTGGGACAAG 
GGGTAG

Protein sequence

MSESTAPAPL PAARKAGCPF DPPEDLARLR RDHPISPMAY PDGHIGWLVT SHALVRAVLA 
DPRFSHRADL THSPLSGART GAPRPAPPGI FTSMDPPEHT RYRRLLTGQF TVRRMRRLTG 
RIHEITAEHL DAMERQGPPV DLMEAFALPI PSLVICELLG VPTTERAGFQ SDMSKLMSLE 
VSTDEKIAAF GTLQAFMLDL VLAKRAEPAD DLLSGLVTGT DLTDEELTNI GGVLMGAGFE 
TTANMLSLGA YALLGHPEQL AALRADTGLT DKAVEELLRY LSIIPGTVRA ALEDVELGGQ 
LVRAGQSVMV SIPAANRDPE HFADPDTLDL HRPTAGHVAF GHGIHQCLGQ QLARVEMQVG 
IPALFARFPT LRLAVPPDEV PLRTDMMIYG VHRLPVTWDK G