Gene Sros_1625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1625
Symbol
ID	8664902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1731669
End bp	1732997
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID
Product	alpha-glucoside ABC transporter periplasmic- binding protein
Protein accession	YP_003337359
Protein GI	271963163
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.234885
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.190993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA CCATCGCGAC AGTGACGACG GCGGGCCTGG CACTCGCCCT CGCCGCGTGC 
GGCCAGTCCT CCGAGACCGG CGCCTCCCCC GCCGCGAGCA GCAGCTCCTC CGCCGCCGCC 
CCGGCCGCCA AGACGCTTGA GGGCGTGACC ATCGAGGTCG CCGCCAAGTG GACCGGCGCC 
GAGCAGACCA ACTTCCAGGA AGTGCTCAAG GCGTTCGAGG CCAAGACCGG CGCCAAGGTC 
ACCTACGCCT CCACCGGCGA GGACACCGGC GCCTACCTCG GCCCGCGCAT CCAGGGCGGC 
AACCCGCCGG ACATCGCGAT CCTCCCCCAG CCGGGCCTGG TCCAGCAGTA CGCCGACCAG 
AAGGCGCTCA AGCCCCTCGC CCCCGAGGTG CTCAAGCAGA TCGACGACAA CTACACCCCG 
TACTGGAAGG AGCTCGGCTC CGCCGACGGC CAGGCCTACG GCGTGCTGGT GAAGGCGGCC 
CACAAGTCGC TCATCTGGTA CCGCGACCAG GCCTTCCAGG ACGCCGGGGC GCAGCCGCCG 
ACCACCTGGG ACGAGCTCGT CAAGACCGCC CAGGCCGTCG CCGACTCCGG CACCCCGCCC 
TTCTCCCTCT GCGGCGCGTC CGGCTGGACC CTGACCGACC TGTTCGAGAA CGTCTACCTG 
TCCAGCGCGG GCCCGGAGAA CTACACCAAG CTCTCCAAGC ACGAGATCCC GTGGACCGAC 
GCCAGCGTGA CCACCGCGCT GGAGAAGATC GGGCAGCTCG TCGGCAAGAA GGAGTTCCTG 
CTCGGCGGCT CCTCCGGCGC CCTGCAGACC GACTTCCCGA CCTGCGTGAC CCAGGTCTAC 
GGCCAGGACA AGTCGGCGAT GGTCATCGAG GCGGACTTCG TGGCCACCAC CGCCGAGGAG 
TCCGGCGCGA AGCTCGGCGA GGAGGCCAAG TACTTCGCGT TCCCGAAGGC CGGCGACACC 
GAGCCGGTCG TGCTGGGCGG CGACATCGCG GTGGTGCTGA AGGAATCCAA GGGCGCGATG 
GCGCTGCTGG AGTTCCTCGC CTCCAAGGAG GGCGGCGAGA TCTGGGCGAA GCTCCCGGGC 
TACCTGTCCC CCAACCGCAA CGTCTCTCCG GACAACTACC CGGCCGAGCT GACCAAGAAG 
CTCGCCCAGA CGATCATCTC CGCCGGTGAC GCCGTCCGCT ACGACATGTC CGACCTGGCG 
CCCAGCGCCT TCGGCGGCAC CGACGGCAAG GGTCAGTGGA AGCTCCTGCA GGACTTCGTC 
CGCGACCCGT CCAAGATCAA GGACATCCAG TCCAAGCTTG AGGACGAGGC CAAGAAGGCC 
TGGAAGTAA

Protein sequence

MRKTIATVTT AGLALALAAC GQSSETGASP AASSSSSAAA PAAKTLEGVT IEVAAKWTGA 
EQTNFQEVLK AFEAKTGAKV TYASTGEDTG AYLGPRIQGG NPPDIAILPQ PGLVQQYADQ 
KALKPLAPEV LKQIDDNYTP YWKELGSADG QAYGVLVKAA HKSLIWYRDQ AFQDAGAQPP 
TTWDELVKTA QAVADSGTPP FSLCGASGWT LTDLFENVYL SSAGPENYTK LSKHEIPWTD 
ASVTTALEKI GQLVGKKEFL LGGSSGALQT DFPTCVTQVY GQDKSAMVIE ADFVATTAEE 
SGAKLGEEAK YFAFPKAGDT EPVVLGGDIA VVLKESKGAM ALLEFLASKE GGEIWAKLPG 
YLSPNRNVSP DNYPAELTKK LAQTIISAGD AVRYDMSDLA PSAFGGTDGK GQWKLLQDFV 
RDPSKIKDIQ SKLEDEAKKA WK