Gene Sros_8141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8141
Symbol
ID	8671469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8977185
End bp	8978888
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	65%
IMG OID
Product	trehalose synthase
Protein accession	YP_003343539
Protein GI	271969343
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.351371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTCAGC TACCTGAGCC AATTCCGAAC ACCTTCGACG AGGAGAAGCC GCGCGATCCG 
TACTGGTTCA AGCGCGCTGT TTTCTACGAG GTGCTCATCC GGGGTTTCGC CGATTCCAAC 
GGGGACGGCA CCGGAGACAT CCGCGGCCTC ATCGACAAAC TGGACTATCT CCAGTGGCTC 
GGCGTGGACT GCCTCTGGCT GCTGCCCCTG TACGAATCGC CGCTCCGCGA TGGCGGCTAC 
GACATCGCGG ACTTCATGAA GATCCTCCCC GAGTTCGGTG ATCTCGGAGA TTTCGTCAAG 
CTGGTGGACG AAGCCCACAA GCGGGGCATG CGCGTCATCG CCGACCTGGT GATGAACCAC 
ACCAGCGACC AGCACCCCTG GTTCCAGGCC TCCCGCCACG ACCCCGAGGG CCCGTTCGGC 
GACTTCTACG TCTGGAGCGA CTCCGACGAG CTCTACAAGG ACGCCCGGGT CATCTTCATC 
GACACCGAGA CGTCCAACTG GTCCCACGAC CCGGTGCGGG GCCAGTACTA CTGGCACAGG 
TTCTTCTCCC ACCAGCCGGA CCTCAACTAC GAGAACCCGG ACGTGCAGGA CGCGATGCTG 
GAGGTGCTGC GGTTCTGGCT GGACCTGGGC ATCGACGGGT TCCGGATGGA CGCCATCCCC 
TACCTGTTCG AGCAGGACGG CACGAACTGC GAGAACCTGC CCAGGACCCA CGAATACCTG 
AAGCGGGTCA GGGCCGAGGT CGACCGCCTC TACCCCGACC GGGTGCTGCT GGCCGAGGCC 
AACCAGTGGC CGGCGGACGT GGTGGAGTAC TTCGGCGACC CGGCGACCGG CGGCGACGAG 
TGCCACATGG CGTTCCACTT CCCGCTGATG CCGCGCATCT TCATGGCCGT CAGGCGGGAG 
TCCCGCTACC CGATCTCGGA GATCATGGCC CAGACGCCGA AGATCCCCGA GAACTGCCAG 
TGGGGCATCT TCCTGCGCAA CCACGACGAG CTCACGCTTG AGATGGTGAC CGACGACGAG 
CGCGACTACA TGTACTCGGA GTACGCCAAG GACCCCCGGA TGCGGGCCAA CGTCGGCATC 
CGGCGGCGGC TGGCCCCGCT GCTGGAGAAC GACCGCAACC AGATCGAGCT GTTCACCGCG 
CTGCTGCTCT CGCTGCCCGG TTCCCCGGTG CTCTACTACG GCGACGAGAT CGGGATGGGC 
GACAACATCT GGCTGGGCGA CCGCGACGGC GTCCGCACTC CGATGCAGTG GAGCCCCGAC 
CGCAACGCCG GGTTCTCCGA CTGCGACCCC GCCCGGCTCT ACCTGCCGGT CATCATGGAC 
CCGATCTACG GCTATCAGGC GATCAACGTC GAGGCGCAGC AGAAGAGCTC CGGCTCGCTG 
CTGCACTGGA CCAAGCGGAT GATCGACATC CGCAAGCGCC ACCCGGTCTT CGGCCTGGGG 
GCGTTCACCG AGCTGAACTC CTCCAACCCG AGCGTCCTCG CCTACGTGCG CGAGTACGGC 
GACGACCGCA TCCTGTGCGT CAACAACCTG TCGCGGTTCC CGCAGCCGGT GGAGCTGGAC 
CTGCGCCGGT TCGAGGGATC GGTGCCCGTC GAGACCATGG GCGGAGTACC GTTCCCACCG 
ATTGGCGAAC TTCCGTATCT TTTGACGCTT CCTGGGCATG GGTTCTATTG GTTCACCCTG 
CCACCCGTAA CCCAGGAGGC GTAA

Protein sequence

MSQLPEPIPN TFDEEKPRDP YWFKRAVFYE VLIRGFADSN GDGTGDIRGL IDKLDYLQWL 
GVDCLWLLPL YESPLRDGGY DIADFMKILP EFGDLGDFVK LVDEAHKRGM RVIADLVMNH 
TSDQHPWFQA SRHDPEGPFG DFYVWSDSDE LYKDARVIFI DTETSNWSHD PVRGQYYWHR 
FFSHQPDLNY ENPDVQDAML EVLRFWLDLG IDGFRMDAIP YLFEQDGTNC ENLPRTHEYL 
KRVRAEVDRL YPDRVLLAEA NQWPADVVEY FGDPATGGDE CHMAFHFPLM PRIFMAVRRE 
SRYPISEIMA QTPKIPENCQ WGIFLRNHDE LTLEMVTDDE RDYMYSEYAK DPRMRANVGI 
RRRLAPLLEN DRNQIELFTA LLLSLPGSPV LYYGDEIGMG DNIWLGDRDG VRTPMQWSPD 
RNAGFSDCDP ARLYLPVIMD PIYGYQAINV EAQQKSSGSL LHWTKRMIDI RKRHPVFGLG 
AFTELNSSNP SVLAYVREYG DDRILCVNNL SRFPQPVELD LRRFEGSVPV ETMGGVPFPP 
IGELPYLLTL PGHGFYWFTL PPVTQEA