Gene Strop_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1557
Symbol
ID	5058010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	1769350
End bp	1770636
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	67%
IMG OID	640473825
Product	extracellular solute-binding protein
Protein accession	YP_001158401
Protein GI	145594104
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.920193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCA CCACGCGGCG TTCCCGCCTG GCGGTCAGCG CCCTTGCCGC GATCACCGCC 
GTCGGCGGCC TCGCGGCCTG CGGCAACGAC GACGAACCGG CCGCCGGCGA GAAGCCCAGC 
AAGCTGGTCG TCGAAACGTT CGGCGAGTTC GGCTACGACG AACTCATCAA GCAGTACGAG 
AAGGACACCG GCATCAAGAT CGAGCTGCGC AAGACCGCGC AGCTGGGCGA GTATCGACCC 
AAGCTGGTGC GCTACCTGGC CACCGGCAAG GGCGCGGGCG ACGTGGTCGC GCTGGAGGAG 
GGCATCCTCA ACGAGTTCAA GTCCAATCCG CGCAACTGGG TGGATCTCGC TCCGCTGGTT 
GACGACCACT CCGAGGACTA CCTGCCCTGG AAGTGGGAGC TGGGCAAGGC GCCGGACGGC 
CGACTGATGG GTCTGCCGAC CGACGTCGGC AGCCTCGCCG TCTGCTACCG CAAGGACCTC 
TTCGAGGCGG CTGGCCTGCC CACCGAGCGG GACGAGGTCT CGGCGCTCTG GCCGGACTGG 
GACAGCTTCC TGGCGACCGG CCGCGCATAC AAGGATGGCA GCGGCGGCAA GGCCCTCATC 
GACTCGATCA CCGCCGTCTC CGACGCGGCG CTGTTCCAGC AGGGCGACGA CCTCTTCTAC 
GACAAGGAGA ACAACATCAT CGCGGACAGC AGCCCCGCGG TGAAGGCGGC CTGGGACACC 
GCGATCTCGA TGGTCGATAT CTCCGCCAAG GCTGCCACCT GGTCACCGGA GTGGTCCGCC 
GGCTTCAAAC AGGGCAGTTT CGCCGCCACC TTCTGCCCCT CCTGGATGCT CGGGATCGTC 
GTGGAGAACT CCGGCGAAGA GAACAGGGGC AAGTGGGACG TGGCGGCGGT GCCCGGTGGC 
GGCGGCAACT GGGGTGGCTC CTGGCTGGCC GTGCCGGAGC AGAGCTCCTA CCACGAGGAG 
GCGGCGAAGC TCGCCGAGTT CCTGACCAGC GCCACCAGCC AGGTGGAGGC ATTCAAGGCC 
AAGGGTCCGC TCCCCACCCA CCTGGAGGCG TTGCAGGACG AAACCTTCCT CAGCTACACC 
AACGAGTACT TCAGCGACGC CCCGACCGGC AAGATCTTCG GCGAGAGCGT CAGCAAGATC 
GAGCCGATCC ACCTGGGGCC GAAGCACCAG GCGGTGAAGG AGAACGCCTT CGGGCTGGCC 
CTGCGGGCGT TCGAGAACGG ACAGGCCAGT GAGGACGAGG CCTGGCAGCA GTTCACCAAG 
GACGCCGAGA TCCAGGGCGC CTTCTGA

Protein sequence

MSLTTRRSRL AVSALAAITA VGGLAACGND DEPAAGEKPS KLVVETFGEF GYDELIKQYE 
KDTGIKIELR KTAQLGEYRP KLVRYLATGK GAGDVVALEE GILNEFKSNP RNWVDLAPLV 
DDHSEDYLPW KWELGKAPDG RLMGLPTDVG SLAVCYRKDL FEAAGLPTER DEVSALWPDW 
DSFLATGRAY KDGSGGKALI DSITAVSDAA LFQQGDDLFY DKENNIIADS SPAVKAAWDT 
AISMVDISAK AATWSPEWSA GFKQGSFAAT FCPSWMLGIV VENSGEENRG KWDVAAVPGG 
GGNWGGSWLA VPEQSSYHEE AAKLAEFLTS ATSQVEAFKA KGPLPTHLEA LQDETFLSYT 
NEYFSDAPTG KIFGESVSKI EPIHLGPKHQ AVKENAFGLA LRAFENGQAS EDEAWQQFTK 
DAEIQGAF