Gene Sros_4966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4966
Symbol
ID	8668260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5487956
End bp	5489203
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily transporter transmembrane protein
Protein accession	YP_003340509
Protein GI	271966313
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.42222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCTCCA CCGCCCCGGC CGCCGCCCCC AAGACCGGGG GCGGCGGCCA GTCGCGTTTC 
ACCAGGGGCT GGCGGATCGT CGCCGCGCTG GCCGTCACCC AGACCATCGG CTACGGCGTG 
CTCTACTACG CCTTCTCCGT CTTCCTCACC CCCATGGCCC GCGACCTGAA TGCGAGCGGC 
GCCCAGATCG CCGCCGCGCT CACCGGCTCG ATCCTGATCG CCGCGCTGTG CGCGCCGCTG 
GTGGGCCGCC GGCTGGACGC CCACGGCGGC CGGGGCCTGA TGACCGCCGG GTCGGTCCTC 
GGCACGGGCG CCGTGCTGGC CTGGTCACGG GTGGAGAGCC TGCCGCAGCT GTATGCGGTG 
TTCGCCGCGA TCGGCATCGC GTGTGCGATG GTGCTGTACG AGAGCGCCTT CGCCGTCATC 
GTGAGCTGGT TCGACGGCCC CGTCCACGGG CGCGGCCGGG CCAATGCGCT GCTCGCGCTC 
ACCGTCGTCG CCGGGTTCGC TTCCTCGATC TTCCTTCCGC TGACCGGGCT GCTGGTGGAC 
TCCTACGGCT GGCGCCACGC CTTGGTGGTC CTGGCCCTGA TCTACGGGGT GGCGGCCATC 
CCGCTGCACG CGCTCGTCGT GCGCCGCCCC GCCCGCACCG GCCGCCAGGA CACCACGACC 
GAAGAGCGGG CCGGGATCGT CAGAGCCGCC ACCCGCCGGC GGCCGTTCTG GCTACTGGTG 
ATCGCCTTTA CCGCCAATGG CGGCGCGGCG GCCGTGATGG CGGTCCTGCT GATCACCTAC 
CTCATCCACC TGGGCCACTC CCCCGTCCTG GCCGCCACCC TGGCCGGGCT GCTGGGCGTG 
CTGTCGGTGA CCGGGCGCCT GCTCACCACC GGCCTGCAAC GCCGTATGCC CGCCGCGCTC 
ATCGCGGCGG CGATCTTCAC CCTGCAGGGC GTCGCCGCCG CGCTGCTACC GCTGGCCGGG 
CGGACGGTGC CGGGCGCCGT CGGCTGCGTG CTGGGATTCG GGCTCGGATT CGGCATCGCC 
TCCATCACCC TGCCGCATCT GCTGGTCGAC AGGTACGGCA CGGCGGCGTA TGCCTCGCTG 
TCGGGCCGCA TCGCCGCCTT CTCCGTCGCC GACAAGGCCC TGGCCCCGCT GGGAGCGGTC 
GCGCTCGCGC AGGCGGCCGG ATACGCGTGG GTCATGGCAG CAGTGGCCCT CGCCTGTGTG 
GTCGCCGCGG TCGCGTTGCT GGCCTACCAT CGCGTATCGT TTAGATAG

Protein sequence

MSSTAPAAAP KTGGGGQSRF TRGWRIVAAL AVTQTIGYGV LYYAFSVFLT PMARDLNASG 
AQIAAALTGS ILIAALCAPL VGRRLDAHGG RGLMTAGSVL GTGAVLAWSR VESLPQLYAV 
FAAIGIACAM VLYESAFAVI VSWFDGPVHG RGRANALLAL TVVAGFASSI FLPLTGLLVD 
SYGWRHALVV LALIYGVAAI PLHALVVRRP ARTGRQDTTT EERAGIVRAA TRRRPFWLLV 
IAFTANGGAA AVMAVLLITY LIHLGHSPVL AATLAGLLGV LSVTGRLLTT GLQRRMPAAL 
IAAAIFTLQG VAAALLPLAG RTVPGAVGCV LGFGLGFGIA SITLPHLLVD RYGTAAYASL 
SGRIAAFSVA DKALAPLGAV ALAQAAGYAW VMAAVALACV VAAVALLAYH RVSFR