Gene Sros_5051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5051
Symbol
ID	8668345
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5574208
End bp	5575716
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003340584
Protein GI	271966388
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.261408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCTC TGCCCACATT GCTGTTGGCC ATGGACGTCA CAGTGCTCTA CCTCGCAGTG 
CCGCGTTTGG CGGCCGATCT ACGACCCAGC GGCGAGCAGA TGTTGTGGAT CACCGACGTC 
TACGGGTTCA TGATCGCCGG ATTCCTCGTG ACGATGGGGG CGCTGGGCGA CCGGATCGGG 
CGACGCAGGC TGCTGATGTG GGGAGCCGGG GCGTTCGGCA TGGCCTCGGT GGCCGCCGCG 
TACGCCCCCA GCGCGGAGGC GCTGATCGCC GCCCGGGCGC TGCTCGGGAT TGCGGGGGCG 
ACGCTGATGC CCTCCACGCT GGCGCTGATC AGCAACATGT TCCGGGACGC GCGGCAGCGG 
GGAACCGCCA TCGGCATCTG GGCGGCGAGC ATGTCCGGCG GAGTCGCCCT GGGGCCGGTG 
GTCGGCGGGG CGCTGCTGGA ATCGTTCGGG TGGGGGGCGG CGTTCCTGAT CGCCGTGCCG 
GTGATGGCGC TGCTGCTGGT GGGCGGGCCG CTGCTGCTCC CGGAACACCG TGACACCGCC 
GCCGGGCGGC CCGACCTGGT CAGCGTCGCG CTTTCCCTGA TCGCGATGCT GACGATCGTG 
TACGGCGTCA AGCTGCTGTC CCACGGGGGC GACCCGGTCC TGAGCGGCGG GATCGTTCTG 
GCCGGTCTGG CCGCCGGAGC GGTGTTCTGG CAGCGGCAGC GCGGACTCGC CGACCCGGTG 
CTCGACGTGG CGCTCTTCCG GAATCGCGCC CTCACCGGCG CCCTGCTCGT CCTGCTCCTG 
GGCCTGGCCG CCACCGCCGG CACGTACCTG TTCGTCACGC GGTTCCTCCA GGGAGTCGAG 
GGCCTGTCCC CGCTGGCGGC GGGCCTGTGG CTGGTGCCCT CGTCGGTCGC TATGATCCTC 
ACCTCCCTGG TCGCCCCCAT CCTGGTACGG CGGCTGCCCG AGCGGGTCGT GGTCGCCGGG 
TCCCTGGCGG TATCGGCGGC CGGTTTCCTC CTGCTGGCCC TGCTCGACCA GGCGGCCGGG 
CTCCCCCTCC TGATCGCCGG TATCGTCGTC GTCTACGTCG GCCAGGGCCC GATCATGACG 
CTGGGCACCG ACCTCGTTGT CGGCTCCGCC CCGCCCGAGA AGGCCGGATC CGCCGCGGCC 
ATGTCCGAAA CGAGCACCGA ACTCGGCCTG GCCCTGGGCG TGGCCGTCCT GGGCAGCGTC 
GGAGCCGCCG TCTACCGTCA GGCCGTGCCC GCCGCGCTTC CCGCCGACCT CCCGCCGGAG 
GCGACCTCCG CCGCCCGCGA CTCGATCGAG GCCGCGGTCA CCGCCGTCGC CCATCTTCCG 
CCGGCCCAGG CGGGAGCCGT ACTCGCCCTC GCCCGGGAGG CGTTCACCGC AGGCCTCAAC 
CTCGTCGCCG GGATCGGCGC AGTCGCCACC CTGGCCCTGG CCGTACTCGC CTTGGTGGCC 
CTCCGCAGAC GGCCACCGGT CGCCGAACCC GCCCCCGCCG AGACGGCGGA GGTTCTCGGC 
CGGGCCTGA

Protein sequence

MLALPTLLLA MDVTVLYLAV PRLAADLRPS GEQMLWITDV YGFMIAGFLV TMGALGDRIG 
RRRLLMWGAG AFGMASVAAA YAPSAEALIA ARALLGIAGA TLMPSTLALI SNMFRDARQR 
GTAIGIWAAS MSGGVALGPV VGGALLESFG WGAAFLIAVP VMALLLVGGP LLLPEHRDTA 
AGRPDLVSVA LSLIAMLTIV YGVKLLSHGG DPVLSGGIVL AGLAAGAVFW QRQRGLADPV 
LDVALFRNRA LTGALLVLLL GLAATAGTYL FVTRFLQGVE GLSPLAAGLW LVPSSVAMIL 
TSLVAPILVR RLPERVVVAG SLAVSAAGFL LLALLDQAAG LPLLIAGIVV VYVGQGPIMT 
LGTDLVVGSA PPEKAGSAAA MSETSTELGL ALGVAVLGSV GAAVYRQAVP AALPADLPPE 
ATSAARDSIE AAVTAVAHLP PAQAGAVLAL AREAFTAGLN LVAGIGAVAT LALAVLALVA 
LRRRPPVAEP APAETAEVLG RA