Gene Sros_8490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8490
Symbol
ID	8671824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9369081
End bp	9370271
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	71%
IMG OID
Product	major facilitator superfamily permease
Protein accession	YP_003343877
Protein GI	271969681
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.249724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.30566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGACCC CACGCGACAG ACAAGCACGA GTGGCGACCT GGGCCGCCTT CTTCGTCCAG 
GGTCTCTGCT TCGCCACCCT GCTCACCCAT GTGATCGACC TGCAGCACAG GTTCGGGCTG 
AGCGACGGCG ACCTCACCCT CGTCCTGCTG CTCGTTCCGG TGATCGCCGG CATCGGGAGC 
GTCGTGGCCG CCCCCCTGGC CGCCAGGTAC GGCAGCGGCC CGGTCCTGCG GATCTCCCAG 
CTGGGCGTCT GCGCCGTCGT GGCCCTGTCC GGATGGAACA CCGAGCTCGC CGGGCTGTAC 
GTGCTCAGCG CCGTGTTCGG CCTGTTCGTC GGGGCGGTGG ACGCGGCGAT GAACATGCAG 
GCCGTCGCGG TCGAGCGCCG CTACGGCATG AGCGTGCTGA CCGGTTTCCA CGCCGTGTGG 
AGCGTCGGCT CGATGCTGGG CGCCGGGTTC AACTCCGCCT TCACCGCGCT CGGGATGGAC 
CTGGGCTGGT CGTTCTCCAT CCCGGTGGCC ATCGGTGCCG CGATCTCAGC GATCATGCTT 
CCCCGGCTCT ACGACCGGGA CGGGGAGCGG GCTACGGCGC AGGCCGCGCG GACGGCGGCC 
AGGGTGCCGT GGCGGCCGAT CATCCCGCTC TGCCTGGCGA TGGCGTTCCT CTACGTAGGC 
GACGCCGCGG TCTCCAACTA CGGCACCGTC TACATGGAGA GCGCGCTGTC GGCGAGCGGC 
TGGCTGGTGC CCTTCGCCTA TCTCGTCTAC CAGGCGGCCA TGCTCCTCGC GCGGGTCCCG 
GGGGACTTCG CCGTGCGCAG GTACGGCCCT GCCCCGGTCG TCCGCGTGGG AGCGGTGATC 
GCGGCCGTGG GCACGCTCGG CGTCGTCGCC GCCCCCGGTG TCCTGGTGGC CGTCCTGTCG 
TTCGGCCTGA TCGGCATCGG CCTGTCGGTC ATCGCGCCGC AGTCGTTCTC GGCGGCCGGC 
CGTCTCGGCG CCGGAGCCGA GACGGCGATC GCGCGCGTCA ACATGTTCAA CTACGTCGGC 
TTCCTCGTCG GCGCGGCCGT GGTCGGCACC ATCAACGACA CCGTGGACGC GCGGATGGCG 
TTCGTGCCCG CCGCCGTCGT GGTGGCCCTG ATCGTGCCGC TGGCCAAGGG CTTCCAGCCG 
GATCCGGAGC TCACCGCTCA GAAGGTCAGA GGTTCAGAAG GTCAGAGGTA A

Protein sequence

MPTPRDRQAR VATWAAFFVQ GLCFATLLTH VIDLQHRFGL SDGDLTLVLL LVPVIAGIGS 
VVAAPLAARY GSGPVLRISQ LGVCAVVALS GWNTELAGLY VLSAVFGLFV GAVDAAMNMQ 
AVAVERRYGM SVLTGFHAVW SVGSMLGAGF NSAFTALGMD LGWSFSIPVA IGAAISAIML 
PRLYDRDGER ATAQAARTAA RVPWRPIIPL CLAMAFLYVG DAAVSNYGTV YMESALSASG 
WLVPFAYLVY QAAMLLARVP GDFAVRRYGP APVVRVGAVI AAVGTLGVVA APGVLVAVLS 
FGLIGIGLSV IAPQSFSAAG RLGAGAETAI ARVNMFNYVG FLVGAAVVGT INDTVDARMA 
FVPAAVVVAL IVPLAKGFQP DPELTAQKVR GSEGQR