Gene Sros_3075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3075
Symbol
ID	8666362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	3355418
End bp	3356713
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	66%
IMG OID
Product	sugar ABC transporter periplasmic sugar-binding protein
Protein accession	YP_003338768
Protein GI	271964572
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.111769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCCAC CCAGGACGGC GTTAGCGGCA GGGCTGCTGG CGCTGGCGGT TCTCACCACC 
GGGTGCGTGG CGGGCACCTC CGCCGGCGCC CCCTCCGCCG CGGCCGACCA GCCGTTCGAG 
GGTGAGGTCG AATTCTGGAC GATCAACCTG AAGAAGAACT TCAACGACTA TGTCACCGGG 
CTGATCACCC AGTACCAGAA GGAACACCCC AAGGTCACCG TCAAGTGGGT GGACGTGCCC 
GGCCAGGACA GCGCGACCAA GCTGCTCGCG GCCATGGCCA GCGGTGACGT GCCCGACGCG 
GTCAACCTGG GCTCTCCCGA CATCGGCAGG TTCATCCCGT CGCTGGCGCC GATGGACGAC 
TACTTCAAGC CGGAGGACCT CGCCGACTTC CAGCCGAACC TGGTGGAGCC GCTGCGCCAG 
GACGGCAAGC TCTACGGGGT GCCCTGGTAC AACGGCGGCG CCCCGGTGGC GATGTACCGC 
AAGTCGGTCG TGTCCAAGGC CGGCTTCGAC GAGAAGGCGC CGCCGAAGAC CTACGACGAG 
GCACTGGACC TGGCGGCCAA GGTCTACGAC GAGACCAAGG TCTACGGCAT CAACGAGATC 
CCCGGGCCGT CCGTCGTCTC CGTGCTGCGC TACTACGGGG TCACGCTGCT GTCGGAGGAC 
AGGAAGAAGG CGGCGTTCAA CACCCCCGAG GTCGCCGCGA TCATCGAGAG GTTCAAGAAG 
AGCTACGACG AGCACGGCAT CGCGCCGGGC TCCGTCTCCA AGGACGTCCG CGCCCTTCCG 
CAGAGCCTCG ACAACGGCCA GGTCGCCTTC ACGGCCAGCG CCAACGGCTC GACCCTGGTC 
AACATCCAGA AGAACGCCCC CGACATCTAC AAGGACCTCG TCGTCACCGA GCCCGTCCGG 
ACGGCCGGCG GCGGCTACCT GCTCAACGCC CAGCAGACGT TCACGATCCC CAAGGCCTCC 
AAGCACAAGA AGGCGGCGGC CGAGTTCATC AAGTTCTTCA CCAACGGCGC CAACCAGCTC 
GCCTTCTGCA AGATCGTGCC GATCTACCCG TCGACGATCT CCTCGACGAA GGACGCCTTC 
TTCACCGGCA CCGGCGGCAC CGAGCCGATG GACGTCGCCC GCCAGGTGAT CGTCAAGGGG 
CTGCCGAAAC TGGAGTACAC ACCGATGGGC ACGGCCAAGG ACACCGAGCT CGCCGAGTCC 
CTGGCGGAGG AGATCCGCGC CGTGTTCCAG GGACAGAAGA GCGTGAAGGA CGCGCTCGAC 
ACCGCAGAGA AGAATTGGAA TGACGCTCTT GTCTAA

Protein sequence

MTPPRTALAA GLLALAVLTT GCVAGTSAGA PSAAADQPFE GEVEFWTINL KKNFNDYVTG 
LITQYQKEHP KVTVKWVDVP GQDSATKLLA AMASGDVPDA VNLGSPDIGR FIPSLAPMDD 
YFKPEDLADF QPNLVEPLRQ DGKLYGVPWY NGGAPVAMYR KSVVSKAGFD EKAPPKTYDE 
ALDLAAKVYD ETKVYGINEI PGPSVVSVLR YYGVTLLSED RKKAAFNTPE VAAIIERFKK 
SYDEHGIAPG SVSKDVRALP QSLDNGQVAF TASANGSTLV NIQKNAPDIY KDLVVTEPVR 
TAGGGYLLNA QQTFTIPKAS KHKKAAAEFI KFFTNGANQL AFCKIVPIYP STISSTKDAF 
FTGTGGTEPM DVARQVIVKG LPKLEYTPMG TAKDTELAES LAEEIRAVFQ GQKSVKDALD 
TAEKNWNDAL V