Gene Sros_4164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4164
Symbol
ID	8667458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4634518
End bp	4635765
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	71%
IMG OID
Product	putative monoxygenase
Protein accession	YP_003339811
Protein GI	271965615
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0321225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCC CTCGCGACCG GGGCCGGCCG CTGCGGATCA TCATCATCGG CGGCGGCATC 
GGCGGACTGT GCCTCGCCCA AGGGCTGAGG CAGGCCGGTA TCGACGACAT CGTCGTATAC 
GAACGTGACG AATCCGCCCG GGGGCGGATG CAGGGATACC GGTTGCGGAT CAGTCCCGAG 
GGGGAGCGGG CACTACGGCA GTGCCTGCCC CGCCAGGCGC AGGACCTGCT CACCGCGACG 
TCGAACAAGC GGCACGAGGA GGGCCTGGCG GCCTACGACG ATCAGCTCAA CCCGCAGTGG 
GCCCCCGCGT TCGACGATCC GCGCGGCGAC GCGCCGGACA AGGTGGACGC GGTCGACCGG 
GTGACGCTGC GCCGCATACT GCTCGCCGAT CTCGACGGTG TGGTGCGCTT CGGCAAACGG 
TTCACCCACT ACGAGCAGGT GGACGGGGAG GTCGTGGCGC ACTTCGCCGA CGGCGGCTCG 
GACACCGGCG ACGTGCTGGT GGCCGCTGAC GGGGCGAACT CCCAGGTACG GGCCCAGCTA 
CGGCCGGCCG ACCGCGCCCA CGACCTCGGC GTGCGCGCGA TCCTGTCTCG CACCCCGCGG 
GCCGGCGCGA TCGAGGCCGG GTTGCCGGAG GTCCTGCGCG ACCGGTTCGT CAACGTGACG 
GGATCGAACG GACTCCGTCT CGCGCTGATG CCCATGGTCT TCCGCACCCC ACCGCGGGAG 
GCCGCCGAGC GGTTCTGGCC CGGCCTGGGA TTCGACGACA CCGAGGACTA CTACATGTCG 
GTGTTCAGCG TGCACCGCGA GGTTCTGGGG CTGCCCGACG ACTCGTTCTT CGCCATGACC 
GGCGAGGAGC TCCGCGAGCT GGTGCTCGAA CGCACCGCCG GCTGGCATCC GCACCTGCGC 
GGCGTGTTCG CCCACTCCGA GGCGGAGGAG ACCTACCCGC TCGCGCTGAG GGCCACCCTG 
CCCGTCGAGC CCTGGGCGCC GGGGAACGTG ATCCCGCTCG GCGACGCGGT GCACACGATG 
CCGCCGACCG GCGGGGTCGG AGCCAACACG GCGCTGCGCG ACGCCGCCTC GCTGTGCCGC 
GCGCTGACCG CGGTGACGCG TGGCGAGCGG CCACTGCTGG ACGCCGTGGC CGAATACCAG 
GCGGAGATGG TCCGGTACGC GACCGAGGCG ACGAACATGT CGCTGAAGAT CGCCAAATGG 
TCCATGCAGA AGATCGACCT CAGTGAGAAG AAGCTCTCCC AAGCGTAA

Protein sequence

MDTPRDRGRP LRIIIIGGGI GGLCLAQGLR QAGIDDIVVY ERDESARGRM QGYRLRISPE 
GERALRQCLP RQAQDLLTAT SNKRHEEGLA AYDDQLNPQW APAFDDPRGD APDKVDAVDR 
VTLRRILLAD LDGVVRFGKR FTHYEQVDGE VVAHFADGGS DTGDVLVAAD GANSQVRAQL 
RPADRAHDLG VRAILSRTPR AGAIEAGLPE VLRDRFVNVT GSNGLRLALM PMVFRTPPRE 
AAERFWPGLG FDDTEDYYMS VFSVHREVLG LPDDSFFAMT GEELRELVLE RTAGWHPHLR 
GVFAHSEAEE TYPLALRATL PVEPWAPGNV IPLGDAVHTM PPTGGVGANT ALRDAASLCR 
ALTAVTRGER PLLDAVAEYQ AEMVRYATEA TNMSLKIAKW SMQKIDLSEK KLSQA