Gene Sros_3879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3879
Symbol
ID	8667169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4315442
End bp	4316563
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	75%
IMG OID
Product	monooxygenase
Protein accession	YP_003339539
Protein GI	271965343
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.535527
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.325627
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAC TGTCGATCCT CGACCTGTCC CCCGTCCCCT CCGGGGGCAC GACGGGCGAC 
GCGCTGCGCA ACACCCTGGA CCTGGCCAGG CGCGCCGAGG AGTTCGGCTA CCGCCGTTAC 
TGGCTGGCCG AGCACCACTT CGCGCCCGGC GTCGCCGGCG CCGCCCCCGC CGTGCTCATC 
GCCCTCGTGG CGGCCGCGAC CAGCACGATC CGGGTCGGCT CCGGCGCCGT GCAGCTCGGC 
CACCAGACGG CGCTCGCCGT GGTCGAGCAG TTCGGCCTGA TCGACGCGCT GTACCCGGGC 
CGCCTCGACC TGGGCCTCGG CCGGTCGGGC CGGCGCGGGA GCGAGTTCGC CGAGCTCGCC 
AAGAGGCCCC CGCAGCCGCC CGGACCGGCC AGGGTCGTGG ACGGCCTGCT CATCCCGGAA 
CCGTTCTCCT TCGCCGCCCT GGCCGCGTCG CCGCTCCTGG CGCTGTACGG CTCGCTGCTG 
CAGCAGCCGG GCGCGGAGAG CCCCGACTTC GCCGACCAGG TGGACGACAT CCTCGCGCTG 
CTCGCCGGGA CCTACCGGTC GGCCGAGGGG GTGGCGGCGC ACGCCGTACC GGGCGAGGGC 
GCGGACGTGG AGCTGTGGGT GCTGGGCAGC AGCGGCGGTC AGAGCGCGCA GGTGGCGGGG 
GAGCGCGGGC TGCCGTTCGC GGCGAATTAC CATGTCAGCC CGTCCACCGT GCTGGAGGCG 
GCCGAGGCCT ACCGGGAGGC GTTCAAGCCG TCGGAGACCC TCGCCGAACC CCATCTGATC 
GTCTCGGCCG ACGTGGTCGT GGCCGAGGAC GACGACACGG CCCGCGAGCT CGCCTCGCCG 
TACGGATTGT GGGTGCGCAG CATCCGCACC GGCGCGGGCG CGATCCCGTT CCCGACGCCG 
GAGGAGGCCG CGGCGCACGA GTGGAGCGAG GAGGACCACG CGCTGGTCGC CGACCGGGTG 
GCGACCCAGT TCGCCGGCTC GCCGCGGACC GTCGCCGAGA GGCTGCGCGT CCTGCGCGAC 
GTCACCGGCG CCGACGAGCT GCTCGTCACC ACCATCACCC ACGACCACGC CGACCGGGTC 
CGCTCCTACG AGCTGCTCGC AAAGGAGTGG GCCGGCGGCT GA

Protein sequence

MTSLSILDLS PVPSGGTTGD ALRNTLDLAR RAEEFGYRRY WLAEHHFAPG VAGAAPAVLI 
ALVAAATSTI RVGSGAVQLG HQTALAVVEQ FGLIDALYPG RLDLGLGRSG RRGSEFAELA 
KRPPQPPGPA RVVDGLLIPE PFSFAALAAS PLLALYGSLL QQPGAESPDF ADQVDDILAL 
LAGTYRSAEG VAAHAVPGEG ADVELWVLGS SGGQSAQVAG ERGLPFAANY HVSPSTVLEA 
AEAYREAFKP SETLAEPHLI VSADVVVAED DDTARELASP YGLWVRSIRT GAGAIPFPTP 
EEAAAHEWSE EDHALVADRV ATQFAGSPRT VAERLRVLRD VTGADELLVT TITHDHADRV 
RSYELLAKEW AGG