Gene Sros_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4040
Symbol
ID	8667334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	4497413
End bp	4498720
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator transporter
Protein accession	YP_003339691
Protein GI	271965495
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.248694
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0016848
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGCCA CCGAAACCAG GACGCTGCCC ATCGGCGACG CGTTCGACCG GATGCCGTTC 
ACCCGCAGGC ACGTTCTGAT CGCGCTGGCG CTGTTCGTCG CGTTCGTCAT CGAGTCCTGG 
GAGCAGCTCG CCCTCATCTA CGTGTCCGCG GACCTCGGCA CGGCCTTCGG CCTCGACGAG 
GGCGGGATCG GGCTGGTGCT GTCGGCCGTC GCGTTCGGCA TGATCCCCGG CGCGCTGATC 
TGGGGGCCGG TCGCCGACCG GATCGGCCGC CGGCCCGCCT GCGTCTGGTC CCTGGCCGCC 
TACGGGGTGA TCGCGCTGGC CTCGGCGTTC GCGCCGAACG TCGAGACCCT CGTGGCGCTG 
CGAGTGGCCT CCGGGCTCGC GCTGGCGGGC GTCTACACCG TCACCTTCCC CTACTTCCTG 
GAGCTGCTGC CCACCAGGAG CAGGGGCAGG GCGGCGGTCT ACCTGTCGAT CGGCTGGCCG 
ATCGGCATGC TGGCCGCCAT CGGCGCCTCG GTCTGGCTGG GCGACCTCGG CTGGCACGTG 
GTCGTCATCG CCAGCGCGGT GGCGGGCCTG TGGGCGTTCG CGATCAGGGC CTGGGTGCCC 
GAGTCGCCCT ACTGGCTGGC CGCGAGGGGC CGCCAGGACG AGGCCCGGGC GGTGCTGCGC 
CGGCTGGGCA GCCCCGACGC CGACGCGGTC TTCACGGTCG CCACCGAGCG CGCCGGTCAC 
CCGCTGGACC TGCTGCGCGG CAGGCTCCGC AGGATCACGG TGCTGATGCT GCTGCTGAAC 
TTCGCCTTCA ACTGGGGCTA CTGGGGCCTG CAGACCTGGC TGCCCACGCT GCTGCAGGAG 
AAGGGGCTGA GCATGGACGC GAGCCTCGGC TTCGCGGCGC TCAGCGCCCT CATGATGATC 
CCGGGCTACG TCAGCGCGTC GCTGCTCACC GGCCGTTTCG GCCGCAAGAA GGTCTTCCTG 
GTCTACGTGG TGGCCGCGGC CCTCGGCGGG CTGGGCTTCG CCACCGCGTC CACGATGACC 
GGCCTCTACG TGGGCAACTT CGTCCTGTCG TTCTTCAGCC TGGGCGCCTG GGGCGTGTGG 
AACACCTGGA ACGGCGAGTT CTACCCGACC GCGCTGCGCG GCACCGGCTA CTCCTGGGCG 
ACCGCCTCCC AGCTCGTGGC CACCACCGTC GCCCCGTCGG CGGTGGGGAT GCTGCTCGCC 
CACGCCACCG GCTTCACCGC GACCATGCTG GTGATCAACG CGTTCATGGT GGTGACGGCG 
CTGCTGGCCG TACCGCTGCC GGAGACCGAG GGGCGCGGCC TGGAATGA

Protein sequence

MTATETRTLP IGDAFDRMPF TRRHVLIALA LFVAFVIESW EQLALIYVSA DLGTAFGLDE 
GGIGLVLSAV AFGMIPGALI WGPVADRIGR RPACVWSLAA YGVIALASAF APNVETLVAL 
RVASGLALAG VYTVTFPYFL ELLPTRSRGR AAVYLSIGWP IGMLAAIGAS VWLGDLGWHV 
VVIASAVAGL WAFAIRAWVP ESPYWLAARG RQDEARAVLR RLGSPDADAV FTVATERAGH 
PLDLLRGRLR RITVLMLLLN FAFNWGYWGL QTWLPTLLQE KGLSMDASLG FAALSALMMI 
PGYVSASLLT GRFGRKKVFL VYVVAAALGG LGFATASTMT GLYVGNFVLS FFSLGAWGVW 
NTWNGEFYPT ALRGTGYSWA TASQLVATTV APSAVGMLLA HATGFTATML VINAFMVVTA 
LLAVPLPETE GRGLE