Gene Sros_1535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1535
Symbol
ID	8664811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1623736
End bp	1625187
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	69%
IMG OID
Product	9-cis-epoxycarotenoid dioxygenase
Protein accession	YP_003337271
Protein GI	271963075
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.194369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.146884
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAAC CTGTGGTGGT CATCGACGAG TCGGGCGAGC CGAATCCGTA CCTGATGGGC 
GTCTACGCCC CGGTCCAGGA CGAGATCACG GCGGAGAACC TCAAGGTCGT CGGGGAGATC 
CCGAAGGATC TCAACGGCGT CTACCTGCGC AACGGGCCGA ACGCGCGGTT CCCGGCCAAG 
GGGCGCTACC ACTGGTTCGA CGGGGACGGC ATGGTGCACG CCGTGCACTT CGAGAACGGC 
AGGGCCCGCT ACCGCAACCG CTATGTCAGG ACCAGGGCGT TCGAGGCGGA GTCGGCCGCC 
GGAAGATCGC TCTGGACCGG CGTCATGGAG AACCCCAAGG GCAACCCGTT CGGCAACACC 
CGCGGGCTCA ACCTCAAGGA CTCGGCCAAC ACCGATGTGA TCTTCCATCG GGGCAAGGTC 
CTCACGACCT GGTACCTGTG CGGCGCGCCG TACGGCATGG ACCCCCTCAG CCTGGAGGCG 
CTGGGCGCGG AGACCTTCCT CGACACCCTG ACCGGCGACT TCATGGCGCA CCCCAAGCTG 
GACGAGCGGA CCGGGGAGCT GTTCTGGTTC GACTACGGGC CCGGCAGGCC CTATCTGCGC 
TACGGGGTGG TCGGCGCCGG AGGCCGGGTG GAGCACTGCG TGGAGCCGGA CCTGCCCGGG 
GCACGGCTGC CGCACGACAT GGCGATCACC GCCAACCACG CGATCCTCAT GGACCTGCCG 
CTCTACCAGG ACATGGACGC CGCCCGGCAG GGCCGCTACA AGCTGACCTT CAACCGGGAG 
CTGCCCTCCC GCTTCGGGGT CATCCCGCGC CGGGGCCAGG CGCACGAGAT CCGCTGGTTC 
GAGGCGGAAC CCTGCTACAT CTACCACGTC GTCAACTCCT GGGAGGAGAG CGACGAGATC 
GTCATGGACG TGTGCCGGGT GTCGCGGCCC GCGCCCGCCG GGAGCGGGAG CCCGCTGGCC 
CGGATGATCT CCTACCTCAA GCTCGACGCC CGGATGCACC GCTACCGGTT CGACCTGCGC 
ACCGGCCGGA CGCACGAGGA GTCCGTCGAC CCGGACCACA ACACCGAGTT CCCGTCGATC 
GACGCCCGCC TGACCGGCCG GAGGTCGCGC TACGCCTACA ACGTCTCGGT CAAGGACGCC 
GCCACCAACC TCTTCGACGG CCTGGTCCGC TACGACAACG TGACCGGCGC CAAGGAGACC 
TACTCCTACG GCGAGCACCG CTACGGCAGC GAGGCGCCGT TCGCCCCGCG TGACGGCGCC 
ACCGCCGAGG AGGACGGCTA CCTCGTCAGC TTCGTCACCG ACGAGCGCGA GGGCACCTCC 
GAGGTGCAGG TCCTGCACGC CGCGGACCTG AGTGCCGGGC CGGTAGCCCG GATCATCCTC 
CCCCAGCGCG TGCCGCTCGG CTTCCACGCC ACCTGGGTCC GCGCCGACCA GCTGAAGGGC 
GGGACCGGAT GA

Protein sequence

MAEPVVVIDE SGEPNPYLMG VYAPVQDEIT AENLKVVGEI PKDLNGVYLR NGPNARFPAK 
GRYHWFDGDG MVHAVHFENG RARYRNRYVR TRAFEAESAA GRSLWTGVME NPKGNPFGNT 
RGLNLKDSAN TDVIFHRGKV LTTWYLCGAP YGMDPLSLEA LGAETFLDTL TGDFMAHPKL 
DERTGELFWF DYGPGRPYLR YGVVGAGGRV EHCVEPDLPG ARLPHDMAIT ANHAILMDLP 
LYQDMDAARQ GRYKLTFNRE LPSRFGVIPR RGQAHEIRWF EAEPCYIYHV VNSWEESDEI 
VMDVCRVSRP APAGSGSPLA RMISYLKLDA RMHRYRFDLR TGRTHEESVD PDHNTEFPSI 
DARLTGRRSR YAYNVSVKDA ATNLFDGLVR YDNVTGAKET YSYGEHRYGS EAPFAPRDGA 
TAEEDGYLVS FVTDEREGTS EVQVLHAADL SAGPVARIIL PQRVPLGFHA TWVRADQLKG 
GTG