Gene Sros_3495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3495
Symbol
ID	8666783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3864976
End bp	3866439
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	72%
IMG OID
Product	extracellular solute-binding protein, family 1
Protein accession	YP_003339174
Protein GI	271964978
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.413396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACAGCC ATTCGCCCCA GCCGAGCAGG CGCGACGTCC TCCGTGGCGC CCTGGCCGCC 
GGAGCGTCAC TGACTCTGGC CGGGAGCCTG AGCGCCTGCG GATCCCGCAG CGACGCGCCC 
CGGACCGCCG GCGGCGACCA GTGGCGCCAG TTCAAGGGCG CCACCCTGAA CTTCATCTCG 
GAGAACACCG CTCCCACCGC GGCCATCGCC GCCGACCTCC GCCCCTTCAC CGACCTGACC 
GGGATCAACG TCAACATCGT GACGCTCGAG CTGACCGCGC TGGTCCAGCG GGTCGCCCTC 
GACCTGGCCT CGGGACGGGC CCAGTACCAG GTGGTCTACG CCGACCCCTA CCAGGTGCTC 
GCGCCGTACC AGCGGGGGCT GGTGGACCTG CGTTCGCTGC AGGCCGATCC GGGCCTGCCG 
GACCTGCCCG GCGGCGTCAC GGACTTCATC CCCACCCAGC TCGACGCCGC CGGCCGGTTC 
GTCGAGCCCG GACCGATCTA CGCCCTGCCG TACGACGCGC CGACGATGAT CTGGCAGTAC 
CGGAGCGACC TGTTCGGCAA GTACCACGAC CGCATGGCCG ACGACCTCGG TTTCGACCCC 
GCTCCGGGCG GCGACCGGAC GTGGGAGGAG TACTTCGGGA TCGCCCGCTG GTTCAACAAG 
AACGCGACGT CGGACGTCAA GTACGGCACC GGGCACCAGG CCCGCCAGCA CGACTCCCTG 
ATGAACGACT TCAGCAACGT GCTGTGGTCC TACGGCGGGG ACTACTTCGC CAACGGCCGG 
GAGGTGGGGC GCATGGGGTC GCGGGATCCC GGCCCGTGCC GGCTCGACTC CGAGGCCGCG 
ATCGCGGGCG CGGAGTTCTA CAACCGGCTG CTCGGCATCG CCGACCCCGC CTCGAAGACG 
TGGGACTGGG ACGGCGTGGG CGCCGCGTTC CGCGCCGGCC GGCTGGCGAT GTGCCCCAAC 
TGGCACGAGT ACGCGGCCAG CAACGAGCTG GTGCTGCCCG GCAAGGTCGG CTACGCGCCG 
CTGCCCAGGG GACCGGCCGG CACCGCCAAC ATGTACGGGG GAACCGGGGT GGCGATCAGC 
GCCAACACGC TGGCCCACGA GCGCGGCGCG GCCTGGCTGT TCCTCGTGTG GGCCACCTCG 
CCCCAGACGC AGCTCGCCAA CCTCAGGAGC AAGGCCGGCG GCGGCACCCC CACCCGCACC 
TCCGTGTACG AGCTGCCGGA GGTGCGCGCG GCCGAGAAGC GGCCGTCGCC GATGCCCAAC 
ATGCTCACGG CCGCCGCGGT GCGGCAGGCC TGGCAGGCCG ACCGGATCGG CCTCCGTCCC 
AAGATCCCGA TGTGGAACGA GTGCAACACG GCGATCTTCA CGCAGCTGTC CCGGATGCTC 
ACCGGGGGCG CGTCGCCGGA GGAGGCGATG CGTTCGATCA CGTCGCGGGT GGACCGGATC 
GTGGCACGAG GGTGGGTGGC CTAG

Protein sequence

MDSHSPQPSR RDVLRGALAA GASLTLAGSL SACGSRSDAP RTAGGDQWRQ FKGATLNFIS 
ENTAPTAAIA ADLRPFTDLT GINVNIVTLE LTALVQRVAL DLASGRAQYQ VVYADPYQVL 
APYQRGLVDL RSLQADPGLP DLPGGVTDFI PTQLDAAGRF VEPGPIYALP YDAPTMIWQY 
RSDLFGKYHD RMADDLGFDP APGGDRTWEE YFGIARWFNK NATSDVKYGT GHQARQHDSL 
MNDFSNVLWS YGGDYFANGR EVGRMGSRDP GPCRLDSEAA IAGAEFYNRL LGIADPASKT 
WDWDGVGAAF RAGRLAMCPN WHEYAASNEL VLPGKVGYAP LPRGPAGTAN MYGGTGVAIS 
ANTLAHERGA AWLFLVWATS PQTQLANLRS KAGGGTPTRT SVYELPEVRA AEKRPSPMPN 
MLTAAAVRQA WQADRIGLRP KIPMWNECNT AIFTQLSRML TGGASPEEAM RSITSRVDRI 
VARGWVA