Gene Sros_3539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3539
Symbol
ID	8666827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3926527
End bp	3927714
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	72%
IMG OID
Product	transcriptional repressor of the xylose operon
Protein accession	YP_003339218
Protein GI	271965022
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.689033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGAC CTGAGCGCAG GACGGTCCGG GATGTCCGCA AGGGCAACCA GTCCATGCTG 
CTGCGGACGC TGTACTTCCA CGGGCCCGCC AGCCGCAACG AGCTCACCAG GCTCACCGGC 
CTCAGTGCCG CGACGGTCAG CAGCATGACC GGTGACCTGC TCGCCGAGAA CGTCGTCGTC 
GAGGCGGGCC ACGTGGAGTC CGACGGCGGG CGTCCCCGCG TGATCCTGCG GGTCAACCCC 
GTCTACGGCT ACGCGATCGG CGTCGACGTG GCCGACACGC ACGTGCGCGT CGAGCTGTTC 
GACCTGGAGA TGAACGAGAA GGCCAAGGTC GAGTACGCCC TCCGTCCCGC CAGGCATGAC 
ATCGAGCTGG TGGTGCGCCA CATCCTCGCG GGCATCGACG TGGTGCTCGC CGACGGCGGG 
GTCTCCGCCG GGCAGGTGCT CGGCGTGGGG GTCGGCGTCC CCGGCATCGT GGAGCGCGGC 
GGCGACGTGC TCGTCCACGC CAAGACCTTC GGCTGGGACG GCGTCCCCCT CGGCGCCATG 
ATGCGGGCCG GCACCACCTT CCCGGTGTTC ATCGACAACG GGGCCAAGAC GATGGGCCAG 
GCGGAGCTCT GGTTCGGCGC GGGGCGCGGG GCCGGTGACG CGGTGATCGT GCTCATCGGC 
TCGGGGGTCG GGGCCACCGT CGTCACCGAC GGGACGACCT TCCGCGGGGT GAGCAGCAGC 
GCGGGCGAGC TGGGGCACAC CAAGATCGTT GTGAATGGCC GGATCTGCCG GTGCGGGGGG 
CGGGGCTGCC TGGAGGCCTA CGTCGGGGCC GAGGCCATCC TCGACCGTGC CGGGATTCCC 
ACCCGGACGG CCGACTGGCA GGCCGAGCTG GCCGGCCTGC TCGAAACCGG ATCGCCGGTG 
CTCGCGGAGA CCGCCACCTA CCTGGGCGTC GGCCTGTCCA ACCTGATCAA CCTGATCAAT 
CCCGAGCGGA TCGTCATCGG CGGCTGGGCC GGTCTCCTGC TCGGCCGGCA CCTGCTCGCC 
GAGATCCGCG CGGCCTCGGC GGACAACTCC CTGGCCCAGC CGTACGCGGC CACTTCCATC 
GTGCTGGGCC GCCTCGGTCC CGACGCCGTG GCACTGGGGG CGGCCACCCT GGTTCTGGAG 
AAGTTCCTGA GCGCCCATCC CGCCGCGCAG GCCTCCGCCG TCCAGTGA

Protein sequence

MVRPERRTVR DVRKGNQSML LRTLYFHGPA SRNELTRLTG LSAATVSSMT GDLLAENVVV 
EAGHVESDGG RPRVILRVNP VYGYAIGVDV ADTHVRVELF DLEMNEKAKV EYALRPARHD 
IELVVRHILA GIDVVLADGG VSAGQVLGVG VGVPGIVERG GDVLVHAKTF GWDGVPLGAM 
MRAGTTFPVF IDNGAKTMGQ AELWFGAGRG AGDAVIVLIG SGVGATVVTD GTTFRGVSSS 
AGELGHTKIV VNGRICRCGG RGCLEAYVGA EAILDRAGIP TRTADWQAEL AGLLETGSPV 
LAETATYLGV GLSNLINLIN PERIVIGGWA GLLLGRHLLA EIRAASADNS LAQPYAATSI 
VLGRLGPDAV ALGAATLVLE KFLSAHPAAQ ASAVQ