Gene Sros_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2047
Symbol
ID	8665329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	2200299
End bp	2201738
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	69%
IMG OID
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_003337775
Protein GI	271963579
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.5548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGACC ACCCCCCTGC AGGAGGAAGC ATGACCCATC TGTCCCGGCG CGAGCTTCTG 
CGCAGCGCGG CCCTGGCGGG GCTCGCCCTG CCGGTCCTGT CCGCGTGCGC CAGTCCCGCG 
GGCGGAGGCG GCGCCTCCCC GGCGGCGCCG GCCGCCGGGG CCACCAGCGC GGCCAACCCG 
CTCGGCCTCG CCGAGAGCAA GCCCCTGGAA GTCTGGATCT TCGACGGCGG GTTCGGCGAC 
GCCTACGCCA AGGACGTCCA CGAGCCGCTG GTCAAGGGCA AGTTCCCCAA GCTGGAGATC 
AAGCACAACA CGACCAAGGA GATCGCCAAG ACCCTCCAGC CGCGCTTCGC CGGCGGCAAC 
CCGCCGGAGT TCATCAACAA CTCCGGCGCC AACGCGATGG ACTTCGGGGC ACTGGTCCAG 
GACGGCCAGC TCGCCGACCT CACCCCCCTG TACGACGCGC CGAGCTGGGA CGACCCCGCC 
GTCAAGGTGC GCGAGACGAT CGACCCGGCC GCGATCGAGC TGGGCAGCTA CGACGGCAAG 
CCGTACGTCC TCAACTACGC CAACACCGTC TGGGGCATCT GGTACTCCCA GAAGCTCTTC 
GAGGCCGAGG GCTGGCAGCC GCCCAAGACG TGGGCGGAGT TCCTGCAGCT CTGCGAGGCC 
ATCAAGAAGT CCGGGAAGAT GGCGCCGTTC ACCTACGCGG GCAAGCACCC CTTCTACATC 
TACGAGACCA TCCTCACCCT CGCCGCGAAG ATCGGCGGCA AGGACGTGCT GAAGAACATC 
GACAACCTGG AGGACGGCGC CTGGCAGGCC GAGCCGGTCA AGCAGGCCGC GACCGCCTTC 
GCCGAGCTCG GGGCCAAATA CCTCCTCCAG GGCACCGCCG GCCTGGACCA CGTCCAGACC 
CAGACCGCCC ACAACAAGGG CCAGGTCGCC ATGCTGCCCT GCGGCTCCTG GCTGGAGAAC 
GAGCAGAAGG ACTCCACCCC GGCCGACTTC GGCTACGCGA TGTTCGCGCT GCCGGACTTC 
GGCTCCTCCG ACGCCCTGCC GTACGGCACG CTGCACGCCC GGCCGGGGGA GGAGTACATC 
GTCCCGGCCA GGTCGGCCAA CCCTCAGGCG GGCCTGGAGT ACATGCGGGC GATGCTCTCC 
AAGGAGGGCG CCGGCAAGTT CATGGAGCTG GTCTCCACGC TGACCGTCGT CAAGGGCGCG 
GGTGAGGGGC GCACGCTCAA GCCGGGACTG AAGAGCGCCT CGGCCGCCCT GACCGCGGCG 
GGCGACAACG CCGTCTGGTT CCTGTTCCGC AAGTGGTACG TGGAGATGCA CGACGAGGTG 
GCCGCGGCGA CCGGGCAGTT CATGAACGGC AAGCTGACCG TCGACCAGTG GATCGAACGG 
GCGCAGAAGA AGGCTGACTC GATCAAGAAC GACTCCTCGG TGAAGAAGTT CAAGAGGTAG

Protein sequence

MPDHPPAGGS MTHLSRRELL RSAALAGLAL PVLSACASPA GGGGASPAAP AAGATSAANP 
LGLAESKPLE VWIFDGGFGD AYAKDVHEPL VKGKFPKLEI KHNTTKEIAK TLQPRFAGGN 
PPEFINNSGA NAMDFGALVQ DGQLADLTPL YDAPSWDDPA VKVRETIDPA AIELGSYDGK 
PYVLNYANTV WGIWYSQKLF EAEGWQPPKT WAEFLQLCEA IKKSGKMAPF TYAGKHPFYI 
YETILTLAAK IGGKDVLKNI DNLEDGAWQA EPVKQAATAF AELGAKYLLQ GTAGLDHVQT 
QTAHNKGQVA MLPCGSWLEN EQKDSTPADF GYAMFALPDF GSSDALPYGT LHARPGEEYI 
VPARSANPQA GLEYMRAMLS KEGAGKFMEL VSTLTVVKGA GEGRTLKPGL KSASAALTAA 
GDNAVWFLFR KWYVEMHDEV AAATGQFMNG KLTVDQWIER AQKKADSIKN DSSVKKFKR