Gene Sros_4889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4889
Symbol
ID	8668183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5414584
End bp	5415873
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	69%
IMG OID
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_003340449
Protein GI	271966253
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.278868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.377169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGCAC CATCTCGTCT GCTCGGCGCG GCGATCGGCG CCGTCCTCGC CCTGTCCCTC 
TCCGGCTGCG GGTCGTCCGC CTCGGAGGGG ACCGGTCAGG TGAAGCTGAC CCTCTGGCAC 
AACAGCGCGG ACCCGGCGCC GCTGCTGGAG ATGTACAAGA AGTTCGAGAA GCAGTCCGGC 
CACAGGATCG AGCTCGTGTC GATCCCGTCC GACGGCTTCG AGGACACCAC CCAGACCAAG 
TGGGCCACCG GCGACCGCCC GGACATCCTG GAGTACCACG CGACGGCGAG CGGCCTGCTG 
GCCCTCAACC CGGCCGAGAA CCTGCGCGAC CTGACAGGCG AGGCGTACAT CGCCAGGTCC 
GGCGACCTCT ACCAGGCCGC CGGGTCCGTC AACGGCAAGG TCTACGCCGC CATCACCGGC 
TTCCCCCAGG TCTTCGGCCT CTACTACAAC AAGAAGGTCT TCACCGCGGC CGGGCTGACC 
CCGCCCACGA ACTTCGCCGA GCTCGCCGCC GCCTGCCCCA AGCTCAAGGC CGCCGGGGTC 
ACTCCGGTCT TCGAGTCGGG CGGGTCGATC TGGCCGGTGC AGATCCTGCC CATCCTCTAC 
CTGGCAGGCG CCAACCAGTC CAACGCCTAC GGCAAGGCCA TCGCGGGCCA CAGCAGCACG 
CTGGCCGACG CGGGCTCGCC CTTCGTCTCC GGCCTGACCG CCTACGCCAA GCTGAAGGGC 
GACGGCTGCT TCAACAAGGA CATCGTCACC GCCAAGTTCG AGGACTCCAT GAAGGCCCTC 
GTGACCGGCG AGGCCGCCAT GGTCGCCCAG CACTCCGACA TGCTCCCGGC CCTCCTCGCG 
GCCGCGGGCG GCGACCAGAA GACCGTCGAC GAGTCCGTCG GCTTCGTCGG CCTGTCGAGC 
GACAAGCCGC TCGTGACCTA CGCGCCCGGC CCGATCGGCA CGTTCTACCT GCCCAAGACC 
GGTGACGCGG CGCGGGAGAA GGCGTCGCTC GACTTCGTGC GCTTCATGAC CGGCCCGGCC 
TACGCCGAGT ACATCACCGC GTCCAAGACC TTCCCCGTCC TCAAGGACGT GCCCGACCCG 
CAGGGCGTCT CCTCCGTGCT GCAGGACGTC AAGAAGGCCT ACGACACCGG CGCGGTCATC 
GCCTTCAACT CCGACATCCC CGGCATGGGC GGGCTGGCCC AGCTCATGTC CGAGCTGATC 
GCCGGGCAGA AGGATCCGCA GAAGGCGGCG ACCCAGCTAC AGGGCCAGGT CGAGCAGGCG 
GCCAAGGCGG CAGGACTGCC CGGATGGTGA

Protein sequence

MRAPSRLLGA AIGAVLALSL SGCGSSASEG TGQVKLTLWH NSADPAPLLE MYKKFEKQSG 
HRIELVSIPS DGFEDTTQTK WATGDRPDIL EYHATASGLL ALNPAENLRD LTGEAYIARS 
GDLYQAAGSV NGKVYAAITG FPQVFGLYYN KKVFTAAGLT PPTNFAELAA ACPKLKAAGV 
TPVFESGGSI WPVQILPILY LAGANQSNAY GKAIAGHSST LADAGSPFVS GLTAYAKLKG 
DGCFNKDIVT AKFEDSMKAL VTGEAAMVAQ HSDMLPALLA AAGGDQKTVD ESVGFVGLSS 
DKPLVTYAPG PIGTFYLPKT GDAAREKASL DFVRFMTGPA YAEYITASKT FPVLKDVPDP 
QGVSSVLQDV KKAYDTGAVI AFNSDIPGMG GLAQLMSELI AGQKDPQKAA TQLQGQVEQA 
AKAAGLPGW