Gene Sros_5204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5204
Symbol
ID	8668498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	5720836
End bp	5722002
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	74%
IMG OID
Product	major facilitator transporter
Protein accession	YP_003340721
Protein GI	271966525
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.675914
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCC CTGCGGAGAA GGGCACGATC CCGCGCCTCG CCCTCGCCGG GATCTTCGGC 
GGGCTCTTCT GCGGTTACCT GGGCCTCACC GCGGCGATCC CGGTGCTGCC GGGCTTCGTC 
CGGGACAGCT TCGGCGCCAC CGACGTCGCC GTCGGCATGG TGGTCATGGC GACGGCGCTC 
ACGGCGCTGC TCGTACGGCC CGTCTCCGGC CACCTGGCGG ACCGGTACGG CCATCGTCTT 
GTCATGCAGC TGGGCGCACT GATCGTCGCC GTGGGCGGCG CGCTCTACTT CCTGCCGCTC 
GGCCTGACCG GCCTCATCGG GGTCCGCCTG CTGCTCGGCG TCGGCGAGGC GTCGCTCTTC 
ACGGCGGGCG CCGTCTGGGT CGTGTCGCTC GCGCCGCACC ACCGCCGCGG GCAGCTGATC 
GGGCTCTACG GCGTCAGCAT GTGGGGCGGG ATCTCGGTGG GAACCTTCCT CGGCGCGACG 
CTGCTGCCCC TCGGCTACGG CGCGGTGTGG GGCTTCAGTG TCGCCGCCGC GCTCATCGGG 
CTCGCGCTGA TCAGCTTGGC TCCCGTGTCC CCCCGCACCG AGCAGCCGAG CGGGGGGCAC 
GCCCTGCTGG TGCGCCCGGC GCTGCTGCCG GGGGCGGCGC TCGCGCTCGC CGCCGCCGGG 
TACGCCGGCC TCGCCGCCTT CGTCGTCCTC CACCTCCAGG CCCGTGGCAT CGATTCGGGC 
GTCGTCGTGC TCAGCTGCTT CAGCGCCGTC TACGCCGGCA CGCGGCTGTT CATCGGCCAC 
CTGCCGGACC GGCTCGGGCC GCGCCGCGTC GCGACCTGGT CCGGTGTCGG CGAGGCCGCC 
GGCCTCCTGA TCATCGCCCT GGCCCCGAAC CTGACGGTCG CCGTGATCGG CAGCCTGGTC 
ATGGGAGCCG GATTCTCGCT GTTGCACCCG TCCCTCGCCC TGATGGTGAT GAACCTCACC 
GAGGCGTCGA AGCAGGGAGC CGCGATCGGC GCCTACACCT CCTTCTGGGA CCTGGGCCTG 
AGCGTCTGGG GGCCGGTGAT CGGAGCGGTC GCGACCGGCT TCGGGTACCC CGCCGTGTTC 
GTGGCCGGCG CCGTCTGCGC GGCGGCGGCC GTGGCCGTGG CGCTCTGTGT CCGCCAGCCG 
GCCACGCGGC CGGCGGTCGT GAGCTGA

Protein sequence

MTAPAEKGTI PRLALAGIFG GLFCGYLGLT AAIPVLPGFV RDSFGATDVA VGMVVMATAL 
TALLVRPVSG HLADRYGHRL VMQLGALIVA VGGALYFLPL GLTGLIGVRL LLGVGEASLF 
TAGAVWVVSL APHHRRGQLI GLYGVSMWGG ISVGTFLGAT LLPLGYGAVW GFSVAAALIG 
LALISLAPVS PRTEQPSGGH ALLVRPALLP GAALALAAAG YAGLAAFVVL HLQARGIDSG 
VVVLSCFSAV YAGTRLFIGH LPDRLGPRRV ATWSGVGEAA GLLIIALAPN LTVAVIGSLV 
MGAGFSLLHP SLALMVMNLT EASKQGAAIG AYTSFWDLGL SVWGPVIGAV ATGFGYPAVF 
VAGAVCAAAA VAVALCVRQP ATRPAVVS