Gene Sros_1211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1211
Symbol
ID	8664486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1242424
End bp	1243560
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	77%
IMG OID
Product	transcriptional regulator, SARP family
Protein accession	YP_003336952
Protein GI	271962756
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.705954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.54501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGATG CGCAGCGGGA GAGCCCCCCG CCGGGGCCGG GTTTCGAGTT CGGGGTCCTG 
GGACCGCTCA GGGCGCTGCG CGGCGGCGAT CCCGTGGCGA TCGGGGCGGC CAAGCAGCGG 
GTGCTGCTGG CCTCGTTGCT GATCGACGCC AACCGGGTCG TCCCCGTCGA GACGCTGACG 
GCCCGGCTGT GGGGGGAGGC CCCACCCTGC GGCGCCCGGA ACGCCCTGCA GAACTACGTG 
ATGCGGTTAC GCCGCGTGCT GGGCGGCGCC GGCGGGAGCG ATCCGGTGCT GACCCGTCCG 
CAGGGCTACC TGATCGGCGT GGCCGACGAG GCGGTCGACC TGCACCGCTT CGACGCCCTG 
GTGCGCCGCG CCAGGACGGC CGTCGCCGCC GGCGGGGCGG AACAGGCGTC GGCGCTGCTG 
CGGGAGGCGC TGGGGCTGTG GCGCGGGCAG CCGCTCTCTG ATGTGCCGTC GGAGCTGTTG 
CAGCGGGAGG TCGCGCCGGC GCTGGCCGAG CGCCGGCTGG GCGCCGTCGA GCTGCGCATC 
CAGGCGGACC TGGCCCTGGG GCGGCACGGG GACGTGCTCC CGGAGTTGCG GGAGCTGACC 
GCCGCGCACC CGCTGAGGGA GCGGTTCTGG GCACAGCGGA TGCTGGCGCT GTATCGGTCG 
GGGCGCCGGG GCGAGGCCCT CCAGTGCTAT CGCACCGTCG GCGAGCTCCT CTCGGAGGAG 
CTGGGCATCG ACCCCGGCGC GGAGCTGCGG GAGCTGCACC GGCGGCTGCT GGACGCCGAC 
CCCGCGCTCG CCGGCTCGGA TCCGTCCGGT GGCGGCGCGC CCATCCGCCC GGGGGCGGGC 
GACGGTGACG CGCGGCCGGC CGGCGACCTT CCCGCCGGGA TGACGACGTT CGCCGGGCGC 
GAGCGGCAGC TCGCGGAGGC CCAGCGGCTG CTGGCGCAGG CGCGGGACCG GTTCCGGCGG 
GACGGCGAGG TCGGCGACGC CCACACGGCC ACGACGATGC GGGCCATGGC CGCGGCCCTC 
CTCGGCGCCT GGGCCCACAT GGCCGCCTTC GAGCACGGCG CCCACCCCGA TGACGTCATC 
GGCCCGCCCC TGGGCGAGCA CCCGATCAGC GGGGGGCCGC CGGCCGGGAA CCAGTAA

Protein sequence

MTDAQRESPP PGPGFEFGVL GPLRALRGGD PVAIGAAKQR VLLASLLIDA NRVVPVETLT 
ARLWGEAPPC GARNALQNYV MRLRRVLGGA GGSDPVLTRP QGYLIGVADE AVDLHRFDAL 
VRRARTAVAA GGAEQASALL REALGLWRGQ PLSDVPSELL QREVAPALAE RRLGAVELRI 
QADLALGRHG DVLPELRELT AAHPLRERFW AQRMLALYRS GRRGEALQCY RTVGELLSEE 
LGIDPGAELR ELHRRLLDAD PALAGSDPSG GGAPIRPGAG DGDARPAGDL PAGMTTFAGR 
ERQLAEAQRL LAQARDRFRR DGEVGDAHTA TTMRAMAAAL LGAWAHMAAF EHGAHPDDVI 
GPPLGEHPIS GGPPAGNQ