Gene Sros_8142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8142
Symbol
ID	8671470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8978893
End bp	8980206
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	72%
IMG OID
Product	trehalose synthase
Protein accession	YP_003343540
Protein GI	271969344
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.456805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGACGG AGCTCCTTAC CGGCTGGATA ACCCATCAAC GATGGTTCGC CGGTAAGGGG 
CGGCCGATAG ACGAGCTCGG CGTCGATTCC GACGTCGAGC TCTCCCCCGG CCTGCACCAT 
CTGATCATCT CGGTGCGCCA GGGCGGGGCA CACGACCGCT ACCAGCTCCT GCTCGGCACC 
GACGGGGACG CCTCCGGGCG CTACAGCCAC GCCCGGATCG GCGACGGCTA CTACGACGCC 
GCCTACGACC CCGACCTCAC CGGCACCCTG CTCGCGGGGA TGGCCGGGGA CCGCGACCTC 
GGCCCGCTCC GCTTCCGCCA CCTGGAGGGG GTGGAGATCG ACACCTCCCT GCGGAGCCTC 
GTGCTCGGCG CGGAGCAGTC CAACACCTCC CTGGTGTACG GCGAGACCTA CATCTGCAAG 
CTGTTCCGCC GCCTGATCCC CGGCGTCAAC CCCGAGCTGG AGATCGTCAC CGCCCTGGCC 
CGGCACGGCG CCGGCCACAT CGCGCAGCCG TACGGCTGGA TCGAGACCGA CCTCGACGGC 
GAGCCCACCA CCCTGGCGAT GACCCAGGAG TTCCTCGCCA CCGCCAACGA CGGCTGGGCC 
CTGGCCCTGG CCAGCGTCCG CGACCTGTAC GCCTGCCTGG ACTCCTCGGC CTCCGACGCG 
GGCGGCGACT TCAGCTCCGA GGCCTACCGG CTCGGCGTGG CCACCGCCGA GGTCCACCGC 
GAGCTGGCCG CCGCGTTCCC CACCGACGTG ATGGAGTCGC AGGAGGTCAA GCAGATGGTC 
GAGGACCATC GCCGCCGCCT GGCCGGTGTG ATCGAGGAGG TGCCGCAGCT CGGCCGGTAC 
GCGCGGGTGG CCGAGGAGGC CTACCAGCGG GTCGCCGACG TGGTCTCCGA GATCCCCGTG 
CAGCGCGTCC ACGGCGACTA CCACCTCGGC CAGGTGATGC GCACGACCAC CGACTGGGTC 
GTCCTCGACT TCGAGGGCGA GCCCGGCCAG CCCCTCGCCG AGCGCCGCGC GCTGTCCTCC 
CCGCTGCGGG ACGTGGCCGG CATGCTCCGC TCGTTCGACT ACGCCGCCCG CCACCTGCTG 
GCCGACCATC CCGACGCCGA TGAGCTGCGC CCCCGGGCCG TCGAATGGGC CGAGCTCAAC 
CGCTCGTCCT TCCTGGCCGG CTACTCCGCC GGCGGCGGCC GCCTGCACGC CGAGGACGCC 
ATACTGCTCC GCGCCCTGGA GCTGGTCAAG GCCGTCTACG AGGTCGGCTA CGAGGCCCGC 
AACCGCCCCT CCTGGCTCCC CATCCCCATG GCCGCCTTCC AGGTCGAACG GTAG

Protein sequence

MLTELLTGWI THQRWFAGKG RPIDELGVDS DVELSPGLHH LIISVRQGGA HDRYQLLLGT 
DGDASGRYSH ARIGDGYYDA AYDPDLTGTL LAGMAGDRDL GPLRFRHLEG VEIDTSLRSL 
VLGAEQSNTS LVYGETYICK LFRRLIPGVN PELEIVTALA RHGAGHIAQP YGWIETDLDG 
EPTTLAMTQE FLATANDGWA LALASVRDLY ACLDSSASDA GGDFSSEAYR LGVATAEVHR 
ELAAAFPTDV MESQEVKQMV EDHRRRLAGV IEEVPQLGRY ARVAEEAYQR VADVVSEIPV 
QRVHGDYHLG QVMRTTTDWV VLDFEGEPGQ PLAERRALSS PLRDVAGMLR SFDYAARHLL 
ADHPDADELR PRAVEWAELN RSSFLAGYSA GGGRLHAEDA ILLRALELVK AVYEVGYEAR 
NRPSWLPIPM AAFQVER