Gene Strop_3264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3264
Symbol
ID	5059729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3742197
End bp	3743447
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID	640475512
Product	extracellular solute-binding protein
Protein accession	YP_001160076
Protein GI	145595779
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.591163
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGGA TGCGTAGGGC GGCCGTCGCC GCGGTTGGGG CGCTCGCGTT GCTGTCGCCC 
GCCGCTTGCG GTGGTGCCGA CAGCGGGGCC GACCAGGAGG TGGAGGTCTT CACCTGGTGG 
GCCGACGGGG GCGAGAAGGC GGGCCTCGAC GGTCTGGTCG CTGCCTTCGA CGAGCAATGT 
GACTACTCGT TCGTGAACGG GGCGGTGGCC GGCGGCGCCG GTTCGAACGC CAAGCAGGTA 
CTGGCCTCCC GACTCCAACA GGGCGACGCG CCGGACACCT TCCAGGCCCA CGCCGGCGCC 
GCGCTGTCGG AATACATCGC AGCCGGCCAG ATCGAGGATC TCAGCGCCCT GTACGACGAG 
TGGGGCCTGA CCGAGGCGCT ACCGCCGGGA CTGATCGACA ACCTCAGCGT GGACGGCAAG 
GTCTACTCGG TGCCGGCGAA CGTCCACCGG TCGAACGTGC TCTGGACGAA CACGTCGGTC 
CTGGCCGATG CGGGGATCAC GGCCGAGCCG ACGACGCTGG CCGACCTCCT CGCCGCGCTC 
GACACACTGA AGGCCGCGGG CATCAGTGCG CCGCTCGCGA TCGGCAAGGA CTGGTCCCAG 
CTGATGCTGC TGGAGGCGGT GCTGATCAGT GACCTCGGCC CGGAGGGCTT CACCGGCCTC 
TGGACCGGTG CGACCGACTG GAACAGCCCC GAGGTCACCC AGGGCCTGGA GAACTACAAG 
CGGCTGCTCA GCTACACCAA CACGGACCGG GACACCTACG ACTGGACCGA CGCTGGCAAG 
CTCCTCATGG ACGGCAAGGC CGGCTTCTTC CTGATGGGGG ACTGGGCGCC GAGCGACTTC 
GAAGCCAAGG GCTTCACCGA CTTCGGTTAC ATCACGTTCC CGGGTAACGG GGACACCTTC 
CAGTGGCTCG CCGACTCCTT CGTGTTGCCG CAGGGAGCCG ATAACCCCGA GGGCACCAAG 
TGCTGGCTGA AGACGGTCGG CAGCGCCGAG GGACAGCAGG CGTTCAACCT CAAGAAGGGC 
TCCATCCCCG CCCGTACCGA CGCCGTCGAG GCCGACTACC CCGCCTACCA GCAGTCGGCC 
ATCCAGGCGT GGAAGACCGG CACGCAGGTC CCGTCCTGCG CCCACGGTGC CGCCTGCTCG 
CAGGGTGCCA TCGAGGCCGC GAACTCCGCG ATCGGCAAGT TCTCCAGCGA CCAGGACCTG 
GCGGGACTGC AAAAGGCAAT GTCCGCCGCC GCCGCGCTCG GCAAGAACTA G

Protein sequence

MSRMRRAAVA AVGALALLSP AACGGADSGA DQEVEVFTWW ADGGEKAGLD GLVAAFDEQC 
DYSFVNGAVA GGAGSNAKQV LASRLQQGDA PDTFQAHAGA ALSEYIAAGQ IEDLSALYDE 
WGLTEALPPG LIDNLSVDGK VYSVPANVHR SNVLWTNTSV LADAGITAEP TTLADLLAAL 
DTLKAAGISA PLAIGKDWSQ LMLLEAVLIS DLGPEGFTGL WTGATDWNSP EVTQGLENYK 
RLLSYTNTDR DTYDWTDAGK LLMDGKAGFF LMGDWAPSDF EAKGFTDFGY ITFPGNGDTF 
QWLADSFVLP QGADNPEGTK CWLKTVGSAE GQQAFNLKKG SIPARTDAVE ADYPAYQQSA 
IQAWKTGTQV PSCAHGAACS QGAIEAANSA IGKFSSDQDL AGLQKAMSAA AALGKN