Gene Sros_4174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4174
Symbol
ID	8667468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4644664
End bp	4646529
Gene Length	1866 bp
Protein Length	621 aa
Translation table	11
GC content	69%
IMG OID
Product	transcriptional regulator, SARP family
Protein accession	YP_003339821
Protein GI	271965625
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTTTCT GCATTCTCGG CCCGCTAGCC GTAACCCATG AGGGCCGGGA TATCACTCCG 
ACGGCACCCA AAGTTCGTCA GGTTCTGACG TTTCTTCTGG TGCGCAGGAA TCAGATTGTG 
CAAGTCAGCG AATTCGTCGA TGAGCTATGG AGCAGCCATC CGCCCGACAG CGCCATGACG 
ACTCTCCAGA CCTACATCTA CAAGCTCAGG AAAGACGTGC TGGACCCTTC CGGGCTGGCC 
CGCCTGCACA CCCAGCCCTC CGGATACCTC CTTGACGTCG CCGACGAGAC CATCGACGTC 
TGCGACTTCG AACGGCTGTC GCGGCAGGGT CGCCTCGCGC TGGAGAAGGG CGACCCGCTG 
GGCGCCAGCG AACTGCTGAC CGAGGCCCTG AGCCTGTGGC GCGGTCAGGC GCTCGTCGGC 
GTCACCGCAG GAGAGATCCT GTCCGCCCAC GTGACCCGCC TGGAGGAGAA CAGGCTGCGG 
GCGCTGGAGA TGCACATCGA GGCGGACATG CGGCTGGGGC GCTACCAGGA GCTCATCAGC 
GAGCTGAAGG TGCTCGTCTA CACCTATCCC CTCCACGAAC GTTTCCACGG CGACCTCATG 
ACGGCCCTGA ACCGCTCGGG GCGCCGGTAC GAGGCGCTGG AGGTCTACCG GCAACTGCGC 
GGGGTGCTGA TCGACGAGCT CGGGCTTGAG CCGTCCGCCG CCATGCAACG CCTCCACCAG 
TCACTGCTGA GCGCCGACTC CGCCGACCCG GCCAGGACCA GGCCGGCCCC GCCGGTGGCC 
ACCGCCACGC GGTACGCCGC CACCCTGACG GTCCCGGCAC AGCTACCACC AGACATATCC 
GACTTCACCG GCCGGACCGA GCCTCTTGCT CAAATTCGCC GGATACTCGC CGCCGACCAG 
GACAACCGCA CCACAGCCCG CGCGGTCTCG ATCTGCGGCA TGGCCGGAGC GGGGAAGACG 
ACTCTGGCGC TGCACGCCGC CCACATCAAC CGGGCACAGT ACCCCGACGG GCAGCTCTTC 
GCCGACCTGC GCGGCGCCTC CGCCACCCCC ACACCGCAGA CCGACGTCCT CGCCAGCTTC 
CTGCGCGCCG TAGGCGTGCC CGACCACCAG ATCCCCCCCT CCCTGGAGGA ACGCAGCAAC 
CTCTTCCGCA CCTGGAGCAA CGGCCGGCGG GTCCTGGTCA TCCTCGACGA CGCGTGCGCG 
GCCTCCCAGG TCGCCTCGCT GCTGCCCGCG ACACCCCAGT GCACAGTGAT CATCACCAGC 
CGCGAGGGGC TGCAGAGCCT GCCCGGCGTG CAGACCGTGG AACTCGGCGT CATGAACCTG 
ACCGAAGGCG TGGAGCTGCT CGGCCGCATC ATCGGAGCCG GCCGCGTCGC CGCCGAGCGG 
GAGCAGGCCG AAAAGATCGT CGATCTGTGC GGGCACCTGC CGCTGGCGCT GCGGTCCGTC 
GGCGCCCGAC TGGCCGCCGC GCGGACCTGG CCCCTGCAGA AGATGGCGGC GCTGATCGAG 
TCCGGTCCGG CCCCCCTCGA CCAGCTGCGG TTCGCGGAGT TCGACGTACG GGCCGACTAC 
GACGACACCT ACTTCCGGCT CGATCCCCAC GACCGCAGCG CTCTCCGTCT CCTCAGCCTG 
CTCCCCCCGC AGGATTTCAC CGCCGCGACA GCCGCCGGCC TGCTCGGCAG CGCCGCCGAC 
GCCGTAGAAG CCCAGCTCAC CCGGCTGGTC AGCTGCCACC TGCTCGACGT CAAGTCGGAA 
GGCGGCATCG ACGGCATCCG CTACGAGATG CACAAGCTCA CCCGGCTCTA CGCCCGGGAA 
CGGCTGAACC GCGAGTTCAT CCAACCCGAG ATGAGCTCTC CCCCGCAGCA CGACCACTCC 
ACCTGA

Protein sequence

MGFCILGPLA VTHEGRDITP TAPKVRQVLT FLLVRRNQIV QVSEFVDELW SSHPPDSAMT 
TLQTYIYKLR KDVLDPSGLA RLHTQPSGYL LDVADETIDV CDFERLSRQG RLALEKGDPL 
GASELLTEAL SLWRGQALVG VTAGEILSAH VTRLEENRLR ALEMHIEADM RLGRYQELIS 
ELKVLVYTYP LHERFHGDLM TALNRSGRRY EALEVYRQLR GVLIDELGLE PSAAMQRLHQ 
SLLSADSADP ARTRPAPPVA TATRYAATLT VPAQLPPDIS DFTGRTEPLA QIRRILAADQ 
DNRTTARAVS ICGMAGAGKT TLALHAAHIN RAQYPDGQLF ADLRGASATP TPQTDVLASF 
LRAVGVPDHQ IPPSLEERSN LFRTWSNGRR VLVILDDACA ASQVASLLPA TPQCTVIITS 
REGLQSLPGV QTVELGVMNL TEGVELLGRI IGAGRVAAER EQAEKIVDLC GHLPLALRSV 
GARLAAARTW PLQKMAALIE SGPAPLDQLR FAEFDVRADY DDTYFRLDPH DRSALRLLSL 
LPPQDFTAAT AAGLLGSAAD AVEAQLTRLV SCHLLDVKSE GGIDGIRYEM HKLTRLYARE 
RLNREFIQPE MSSPPQHDHS T