Gene Sros_5531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5531
Symbol
ID	8668825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	6049850
End bp	6051058
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	76%
IMG OID
Product	transcriptional regulator ROK family
Protein accession	YP_003341028
Protein GI	271966832
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.199786
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCCG GAAGCCCGCG CGTCCTGCGC ACCCTGAACG AGCGCGCCAC CCTGGAGCTG 
CTGCTCCGGA GCGGACCGCT CACCCGGGGG GAGCTGGAGA GCCTGACCGG CCTGTCGAAG 
GCCTCCGCGG CCGAGGTCCT GCGCCGCCTG GAGAGCGCCC GCCTGGTGAA GAAGGGCGGG 
CGGAAGCCGG GCAGCGCGGG ACCGGCCGCG CACATGTGGG CGCTGGACGG CTCCTGCTGC 
CATGTGGCCG GGGTCGACGT CACGCCGGAC GCCCTGGACG TGGCCGTCGC CGACCTGACG 
GGGCAGGTGG TCGGCGAGCA CCGCATGGCC ACCCCGGGCA TCCACGACCC GATGGGCTCG 
CTCGCCGTCG CGGTGGCCGA GGCGGCGCGC GCCGCGGGGC TGCGGACCAC CGACCTCGAC 
CAGATCGTCG TGGGGATGCC CGGCGTCATC GACGTCGTCG GCGACCGGCT GGACTCGGTG 
ATCCAGCTGC CCAGCTGGGA GCACGTGCAC GACCTCTCGC CCCTGCGCGC GCGGCTCGGC 
AACGACCGCG TGCGCATGGA GAACGACGTG AACCTCGTCG CGGTCGAGGA GATGGTCAAG 
GGCTCGGCAC GCGACGCGGA GAGCTTCGCG CTGTTCTGGC TGGGCCGGGG CATCGGCGCG 
GGCGTCGTGC TGAACGGCGC CCTGCTGAGA GGCGCCACAG GGCGGGGCGG CGAGATCGGC 
TCCATCGTCG TCCCCGACCC CGCCGAGCGG GGACGGGTGC TGGGCCCGGA GGGCGGGTCG 
CTCGACTCGA TCCTCGGCGC GGAGGCCGTA CTGCGGCTCG CCCGCGCCCA CGGCCTCGCG 
GCGGGCACCG GATCCGGCGG CCCCGCGGCG GACAGCGCGG TGAGCGGCGC GGCGGACGCC 
GTCAGCCGGG CCGTCGCCGA CGGGAGCACC GGCTTCCTCG AGGCGCTGGC CGCCAGGATG 
GCCGTCGGCG TCATCGCGCT GGTCGGCGTC CTCGACCCGC ATCTGGTGGT GCTCGGCGGC 
TCGCTCTGCG CGGCGGGCGG CGAGGAGCTC CGCCGGATGG TCGCCGTCCG GCTGGCCACC 
ACCGCGCTCG CCCGCACCCC GCTGGTGCTC AGCGCGGTCA GCGGCAACGC CGTGCGGGCG 
GGGGCCGTCG AGTTCGCCCT GGGCATCGCG CGCGAGCAGG TTTTCAAGGC CGGTACGGCG 
GGCCGGTAG

Protein sequence

MSSGSPRVLR TLNERATLEL LLRSGPLTRG ELESLTGLSK ASAAEVLRRL ESARLVKKGG 
RKPGSAGPAA HMWALDGSCC HVAGVDVTPD ALDVAVADLT GQVVGEHRMA TPGIHDPMGS 
LAVAVAEAAR AAGLRTTDLD QIVVGMPGVI DVVGDRLDSV IQLPSWEHVH DLSPLRARLG 
NDRVRMENDV NLVAVEEMVK GSARDAESFA LFWLGRGIGA GVVLNGALLR GATGRGGEIG 
SIVVPDPAER GRVLGPEGGS LDSILGAEAV LRLARAHGLA AGTGSGGPAA DSAVSGAADA 
VSRAVADGST GFLEALAARM AVGVIALVGV LDPHLVVLGG SLCAAGGEEL RRMVAVRLAT 
TALARTPLVL SAVSGNAVRA GAVEFALGIA REQVFKAGTA GR