Gene Sros_5540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5540
Symbol
ID	8668834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6060219
End bp	6061451
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator transporter
Protein accession	YP_003341037
Protein GI	271966841
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.477353
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTTCC CCGAAACACC ACCGGCCGCG GCCGGGGCCG AGTGTCCGTC GGCGCCCGCG 
CACGCGCCTG CCGGGGGCGC GCGAGACTCG CGCCGCGCGT GGCTGGCGGC GGCGGGCGCG 
ACGCTCGCCG CATCCGTGGT CTATGGGCTG GCGTACAGCT ACGGGCAGTT CTTCGGGCCC 
ATGGCCCAGG CCTTTCACGC CGGTGACGGC GCGGCGTCCG TGGTCTTCTC GATCACGACC 
TTGCTGGGGT TCGGCCTGAG CGCCGTCACC GGCCCTGTCG CGGACCGGGC CGGGCCCCGC 
CTGATGCTGC TCGTCGGCGC CGTCTGCCTG GGGCTCGGCC TTCACCTCAC CGCGATCTCG 
GACGCGCTGT GGCAGGCGTA CCTGGCCTAC GGGCTCGGTA TTGGGCTGGG AGTCGGGTGC 
GTGTACGTCC CGGTGGTCAC CGCCACCGGC CGCTGGTTCG ACCGCTACCG AACGGTCGCC 
ACCGGCAGCG TGGTCACCGG CGTGGGGATC GGCACGGTCG TCAGCTCGCC GCTGTCGGCC 
TGGATGGTGA GCCATTTCGG CTGGCGGCAC GCCTACGAGT ACTACGCCGT CGGGGGAGCC 
GCTCTGCTGC TGCTGGCCGC CGCCCTCGTC GGCCGGCCGC CACAGGCGCC GGACGCCCCC 
ATCGCCGCGC AACGGCCGCC CGCGCGTGGA TTCCGCACCC TCTACGTGGC GTCGCTGCTC 
GTCTGCATGG CCAACTACGT TCCGTTCGCG CACCTCGCTC TCTCGGCGCA GCGCCTGGGC 
ATCGGCGCCC TGGCCGCCGC GGCCCTGATC TCCGCCATCG GCATCAGCAG CATCGCGGGC 
CGCCTGGTGA TCACCGCCCT CGCCGACCGG TTCGGGTCGC TCGCCCTCTT CAAGGCCTGT 
CATGCGGGGA TCGGCCTGGG CCTGCTGGTG TGGACGACCG CGCGGGGTTA CGGGGGGTTG 
CTGGCGTTCG CGGTCATCCA CGGCACCATG TACGGCGGCT ACAGCGCCCT CCTCCCCGTC 
GTGCTGGCCG ACCAGTTCGG CCTGGCACGC CTCGGCAGGC TGCTCGGCCT GCTGTTCACC 
GCACTCGGCG CGGGCTCCGC ACTCGGCCCC GCGCTGGTCG GCTACCTCGT CCAGAGCACC 
GGCGGGTACG GGACGGCCTT GACGGCTCTG ACCGTGCTCG GCCTCCTGGG CGCCGGCATC 
GTCATGAGCT ACCGGGAGCG GAGCACCCCG TGA

Protein sequence

MSFPETPPAA AGAECPSAPA HAPAGGARDS RRAWLAAAGA TLAASVVYGL AYSYGQFFGP 
MAQAFHAGDG AASVVFSITT LLGFGLSAVT GPVADRAGPR LMLLVGAVCL GLGLHLTAIS 
DALWQAYLAY GLGIGLGVGC VYVPVVTATG RWFDRYRTVA TGSVVTGVGI GTVVSSPLSA 
WMVSHFGWRH AYEYYAVGGA ALLLLAAALV GRPPQAPDAP IAAQRPPARG FRTLYVASLL 
VCMANYVPFA HLALSAQRLG IGALAAAALI SAIGISSIAG RLVITALADR FGSLALFKAC 
HAGIGLGLLV WTTARGYGGL LAFAVIHGTM YGGYSALLPV VLADQFGLAR LGRLLGLLFT 
ALGAGSALGP ALVGYLVQST GGYGTALTAL TVLGLLGAGI VMSYRERSTP