Gene Sros_7741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7741
Symbol
ID	8671063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	8536415
End bp	8539456
Gene Length	3042 bp
Protein Length	1013 aa
Translation table	11
GC content	76%
IMG OID
Product	transcriptional regulator, SARP family
Protein accession	YP_003343153
Protein GI	271968957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0132103
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGGTTTG GACTCCTTGG CCCGGTGCTG GTCCAGGCCG GTGACTCACC CTTACGGATC 
ACGGCGCCCA AACAGCGCAC GGTTCTCGCC ATGCTGCTCG CGCGCGCCGG CTACGTCGTG 
CCGATCCGGT CATTGGTGAC GGAGGTGTGG GACGAGCATC CGCCCCGCTC CGCGGTGGCC 
AACCTGCGCA CCTATCTCAT GCAGCTCCGC AGGATGCTGC CCCCCTGCGA GAATCCGGCC 
GTCGAGCCGC TGGTCACCTC GGACGCCGGC TACCTGCTGC GGGTCGAGCC TGCCGAGTTC 
GACCTCTTCC AGTTCGAGGC GCTCTCCGCG CTCGGCCGCC AGGCGCTGGC CCGGCGGGAT 
CTCGTGACGG CGCAGGACGC CTACACCCGG GCACTCGCAC TGTGGCGAGG GGGAGCGGCC 
GAGGACGCGC CGCTGGGGCC GACCCTGCGC GAGGTGGTCG CCCGCCTCAC CGACCAGTAT 
CTGAGCGCGG TGGAGGAGCA CACCGAGATC CAGCTCGCCC TCGGCAGCCC CACGACGGCG 
GTCAGGCGCC TGCGCGAGCT GATCGGCCGC TACCCCCTGC GGGAACGGCT GTACGGCCAG 
CTCATGGTCG CCCTGTACCG GTGCGGTGAC GTCGCCGGCG CGCTGGACGT CTTCGGGGTG 
GCCCGCCGGA TCCTGGCCGA GGAGCTCGGG CTCGACCCCG GCCCCGAGCT GCGCCTCCTG 
CACCAGGCGG TGCTGCGCCG GGACGCGGAT CTGATGGTGC CGGGCGGGCC GCCGGCCGGC 
GGGGACACCG TGACCGTGGG AGCCGCCGTG ACCGGGGGAG CGGCCGTGCC GGTGGGAGCC 
GCCGTGACCG CGGCGGCGGC CGTGCCGGTG GAGGACACCG TGACCGTGCA CGCCGGGGAC 
GGGCCTCCGC GCCCGCGCCA GCTTCCGCGG GAGCCGCCGC TGTTCGTGGG CCGGCCGGCC 
GAGCTGGCCG GGATGCTCAC CGCGCTGTGC GGCGATCCGG CGCAGGGCGC GGGACCGCCG 
GTGCTGGCGC TGCACGGCCC CGGCGGCGTC GGCAAGTCGA CGCTGGCGCT GCGGGCGGCG 
TACGCCGTGG CCGACCGCTA CGCCGACGGC CAGCTCTACG CCGATCTGCA GGGATCGAGC 
CCGGGGCTGC CGCCGTTGCG GCCGGCCGAG GTGCTCGGCC GTTTCCTGCG GGCACTGGGG 
GTGCCCCACG GCGAGGTCCC CGCCGCACCG GGGGAGGCGG CCGCCCACTA CCAGTCCCTG 
CTGGCCGGCC GGCGGGTCCT GGTCGTCCTC GACAACGCCG TCGACGCGGC CCAGGTGGCA 
CCGCTGCTGC CGGCCGGCGG CGGCTGCGCG GCGCTGGTCA CCAGCCGGAC GGCGCTGACC 
ACCATGGACG CCGTGCCGAT CGCCCTCGAC GTGTTCGACG AGGCGGACTC GGTGCGGATG 
CTCACGCTGC TGGCGGGGCA GGACCGGGTG GCCGCCGAGG CCGGGGCGGC GGCCGACGTC 
GCGCGCTGGT GCGGCTACCA CCCGCTGGCG CTGCGCATCG CCGGCGCCCG TCTCGCCGGC 
CGTCCCGACT GGTCGCTCGT GCGGTTCGGC GAGCGGCTGC GCGACCAGCG GCGACGGCTG 
GACGAGCTGC GGGCGGCCGA CCTGGGCATC CGATCCTGTT TCGAGGTCAG CTACGCGGCG 
CTGACGGGCG GCGCGGGCCG GGGCGGGGGC GCCGCGGCGC ACGCCTTCCG GCTGTTCGGC 
GTGCTCGACG TGCCGGAGAT CAGCGTCGAG CTCGCCGCCG CGCTCCTCGA CGCCGACCTG 
AAGGCGGCGG AGGACGCGCT CGACGAGCTG GCGGAGGTCC GCCTGGTCGA GCCGGCCGGC 
GGCGGGCGGT TCCGCATGCA CGACCTGCTG AGGCTGTTCG CCGCGGAGCT GGCCGTCGTC 
CACGACCCGC CGGACGAGCG CGTGCGGGCC GTACGGCGGG CGCTGGACTG GTACCTCGAC 
CTCTGCCATC AGGTGAACGA CCTGCTCCAG CCGCATCTGC GATCCGGGGA CGGGCACCGG 
CCGAGCCGGC GGGACACCGG GGTGGCCCTG CGCGACCACG TCGAGGCGGT GCGACGGTTC 
GAGACCGAGA TGCCGTGCCT GATCGCGGCC GCGGCCCAGG CGGCGACGGG GGAGCAGGCG 
GTCGCGTGCT TCGTCACCGA CCTGATGCCG CTGGTCAGGG CGCTGGCGAC CAAGTGCGGG 
CACTGGCGGG AGTTCGAGAC CGTCGCACGG CTCGCCATCG GGGTGGCGCG GCGGCACGGC 
GACCGTGCCG GGGAGGCGAC CGCGCTCACG ATGCTGGGAC TGGTGGAGTG GAGGACCGGC 
CGGTCCGAGG CGGCCCGCGA CTGCCTGAGC CGCGCCCTTG AACTCCGGCG CGGCCTGGGC 
GACCGGGAGG CCGAGGGGAT GGCGCTGCAC AACCTCGGCT GGCTGAGCAC GCGCAGCGGC 
GACCTCGACG ACGCCCTCGG TTCCATCACC GCGGGCCTGC GGCTGCTTGA GGCGCACGGG 
TCCAGCCGGG TCGGGATGGT CAGGCACAAC CTGGGCGAGG TCCTGCTGCG GCTCGCCCGG 
TTCACCGAGG CGGCGGACTG CCTCCAGCGG TGCCTGGCCA TCCGCAGGTC GAACGGCGAC 
CGCTTCGGGG AGGGCATCAC CCTGGCCGCG CTCGGCCGCG CCTACTGCCT GCTCGACCGC 
AGGGACGAGG CTCTGGCCAC ACTCGGGGAG GCGCTGCGCC ACTGCCGCGA GACCGGCAAC 
CGGGAGGACG AGTGGGAGGT TCTGCTCAGC AGGTCGGAGA TATGGCTGCG CCGCGGGGAT 
CCGGCCTCGG CCGCCGCCGA CCTCGCCCGG GTGCTGGAGC TGACCGCCCA GGCCGGCGAG 
CTCTACGGCC AGGCCGCCGC CACCCGCCAG CTCGCCAGGG CGCGCGCCGC GCTGGGCGAC 
CCCGCCGCGG CGGAGGACGC CCGCCGGGCC GGGGAGCTCT TCGCCTCGCC CGCCATGCGG 
CCCGATCCGG TGCTGGAGAG GCTGCTCACC GCCCCGCTGT AG

Protein sequence

MRFGLLGPVL VQAGDSPLRI TAPKQRTVLA MLLARAGYVV PIRSLVTEVW DEHPPRSAVA 
NLRTYLMQLR RMLPPCENPA VEPLVTSDAG YLLRVEPAEF DLFQFEALSA LGRQALARRD 
LVTAQDAYTR ALALWRGGAA EDAPLGPTLR EVVARLTDQY LSAVEEHTEI QLALGSPTTA 
VRRLRELIGR YPLRERLYGQ LMVALYRCGD VAGALDVFGV ARRILAEELG LDPGPELRLL 
HQAVLRRDAD LMVPGGPPAG GDTVTVGAAV TGGAAVPVGA AVTAAAAVPV EDTVTVHAGD 
GPPRPRQLPR EPPLFVGRPA ELAGMLTALC GDPAQGAGPP VLALHGPGGV GKSTLALRAA 
YAVADRYADG QLYADLQGSS PGLPPLRPAE VLGRFLRALG VPHGEVPAAP GEAAAHYQSL 
LAGRRVLVVL DNAVDAAQVA PLLPAGGGCA ALVTSRTALT TMDAVPIALD VFDEADSVRM 
LTLLAGQDRV AAEAGAAADV ARWCGYHPLA LRIAGARLAG RPDWSLVRFG ERLRDQRRRL 
DELRAADLGI RSCFEVSYAA LTGGAGRGGG AAAHAFRLFG VLDVPEISVE LAAALLDADL 
KAAEDALDEL AEVRLVEPAG GGRFRMHDLL RLFAAELAVV HDPPDERVRA VRRALDWYLD 
LCHQVNDLLQ PHLRSGDGHR PSRRDTGVAL RDHVEAVRRF ETEMPCLIAA AAQAATGEQA 
VACFVTDLMP LVRALATKCG HWREFETVAR LAIGVARRHG DRAGEATALT MLGLVEWRTG 
RSEAARDCLS RALELRRGLG DREAEGMALH NLGWLSTRSG DLDDALGSIT AGLRLLEAHG 
SSRVGMVRHN LGEVLLRLAR FTEAADCLQR CLAIRRSNGD RFGEGITLAA LGRAYCLLDR 
RDEALATLGE ALRHCRETGN REDEWEVLLS RSEIWLRRGD PASAAADLAR VLELTAQAGE 
LYGQAAATRQ LARARAALGD PAAAEDARRA GELFASPAMR PDPVLERLLT APL