Gene Sros_7141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7141
Symbol
ID	8670452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	7882222
End bp	7883472
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID
Product	cytochrome P450 CYP124E1
Protein accession	YP_003342579
Protein GI	271968383
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.105288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGTTT CACTGGCGGA CATCGACCTG TCCGACATCG CCTTCTGGGA GCGGCCGATG 
GCCGAGCGCG AGGCCGCCTT CGCGCTGCTG CGCGCCCAGG CGGCCCCGGT CCGGTTCGCC 
GAACCGGAGA TCAGCTTCGC CCTTCCGGGG CCCGGATACT ACGCCCTGGT CAGGCATGCC 
GACATCGTCG AGGCCAGCCG CACCCCCGAG GTCTTCTCCT CGGGGCGGGG GTCCACCGCC 
ATCCACGACC TGGGCCCGGA GTTCAGCGAG TACTTCGGCT CGATGATCAA TATGGACGAC 
CCGAGGCACG CCCGGCTCCG CCGGATCGTC TCCCGGGCGT TCACCCCCAA GATGATCAAG 
CAGTTCGAGG CCGACGTGCA GGTCGAGGCC ACCCGGATCG TCGACGACCT GATCGCCCGG 
GGGCCCGGCT GCGACTTCGT CACCGAGGTG GCCGCCAAGC TCCCCTTGAA GATCATCTGC 
GACATGATGG GCATCGGCCC CGAGCATTAC CAGACGGTCT TCGACGCCTC CAACATCATC 
CTGTCCGGCG GCGACCCCGA GTTCATCCAG GACGTCAGCC GCGCGGCCGA GCTGCTCCTC 
GGTGCGGGGC AGCGCCTGCA GGACCTCGTC GTCTCCCTGG CCGCCGAAGG TGGCGACAAT 
CTCATCACCT CGCTGACCAG CGCCAACATC GACGGCGAGA AGCTGACGAT GCAGGAGCTC 
GGCTCGTTCT TCATCCTGCT GGTGGTGGCT GGCAATGAGA CCACGCGCAA CGCCATCTCG 
CACGGCCTGC ACCTGTTCAC CGAGAATCCG GACCAGCGCG CGCTGCTCCT GGCCGACCTC 
GACGGCCGCC TCCCCGGCGC GGTCGAGGAG ATCGTCCGCC TGGCCTCCCC GGTCGCCTGG 
ATGCGCCGGA CCGTCACCCG CGACCACGAG ATGAACGGCC ACCTCTACCG CAAGGGTGAC 
AAGGTCCTGC TCTTCTACTG GGCCGCCAAC CGCGACGAGG CGGTCTTCGC CGACCCCTAC 
CGTTTCGACA TCCGGCGCAC CGAGGGCCCC CACGTGGGCT TCGGCGGCCC GGGGCCGCAC 
TTCTGTCTCG GCGCCCACCT GGCCCGCCGC GAGCTCACCG TGATGTTCCG CGAGCTGTTC 
ACCCGGATCC CGCAGATCCG CTCGACGGGC GAGCCGGACC GCCTGCGCTC CAGTTTCATC 
AACGGCATCA AGCACCTCGA TTGTGACTTC GAAGACGTTC CATTGACGTA A

Protein sequence

MTVSLADIDL SDIAFWERPM AEREAAFALL RAQAAPVRFA EPEISFALPG PGYYALVRHA 
DIVEASRTPE VFSSGRGSTA IHDLGPEFSE YFGSMINMDD PRHARLRRIV SRAFTPKMIK 
QFEADVQVEA TRIVDDLIAR GPGCDFVTEV AAKLPLKIIC DMMGIGPEHY QTVFDASNII 
LSGGDPEFIQ DVSRAAELLL GAGQRLQDLV VSLAAEGGDN LITSLTSANI DGEKLTMQEL 
GSFFILLVVA GNETTRNAIS HGLHLFTENP DQRALLLADL DGRLPGAVEE IVRLASPVAW 
MRRTVTRDHE MNGHLYRKGD KVLLFYWAAN RDEAVFADPY RFDIRRTEGP HVGFGGPGPH 
FCLGAHLARR ELTVMFRELF TRIPQIRSTG EPDRLRSSFI NGIKHLDCDF EDVPLT