Gene Strop_1560 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1560
Symbol
ID	5058013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	1772680
End bp	1774116
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	71%
IMG OID	640473828
Product	glycoside hydrolase family protein
Protein accession	YP_001158404
Protein GI	145594107
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.677245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTAATC CCGCGAGCCC ACCCGCCGTG GGCGTTCTCG CCGAACGCCC GCCACTGGCC 
TTCCCGCCCG GCTTCCTCTG GGGCGCCGCC ACCGCGGCCT ACCAGATCGA GGGCGCGGCG 
ACCGCCGGCG GTCGGACGCC GTCGATCTGG GACACCTTCA GCCACACCCC GGGCCGGGTG 
GTGGCCGGGC ACACCGGTGA CGTGGCGTGC GACCACTACC ACCGCCTCGA CTCAGACGTC 
GCCCTCATGG CCGAGTTGGG GCTGAGGTCG TACCGGTTCT CGGTCTCCTG GCCTCGGGTG 
CAGCCCGGCG GAACCGGCCC GATCAACCAG GAGGGACTCG ACTTCTACCG GCGGCTGGTG 
GACCAGCTGC TGGCGAACGG CATCGAGCCG TGGCTGACTC TCTACCACTG GGACCTGCCG 
CAGCCGCTGG AGGACGCGGG CGGCTGGCCG GCCCGGGACA CCGCCGCCCG GTTCGCCGAC 
TACGCCGCCC TGGTCGCCGG CGCGCTCGGC GACCGGGTGC GGTACTGGAC CACCCTCAAC 
GAGCCGTGGT GCTCGGCGTT TCTCGGGTAC GGTTCCGGGG CGCACGCCCC GGGTCGGTCC 
GACCCCGCCG CCGCGGTCCG GGCCGGTCAC CACCTGCTGC TCGGTCACGG GCTGGCCGTG 
CCGGCGCTGC GGGCGGCCGC CCAGTCCGAG GTTGAGATCG GGGTGACCCT CAACCTGTAC 
CCGGTGACCC CGGCCACCGA TTCGCCCGGC GACGCCGACG CGGCACGCCG AATCGACGGG 
CTGGCGAACC GGTTCTTCCT CGACCCACTG CTGCGCGGGT CATACCCGGC GGATCTGATG 
TCCGATCTCA GGCAGGTCAG CGACTTCGGG CACGTGCGTG CGGGGGACCT GGCCACCATC 
GCCGCCCCGC TGGATCTGGT CGGGATCAAC TACTACAGCC GGCACGTGGT CGCCGCGCCG 
ACGGCGGCGG CCCCGCCGGA GCCGTACTGG CGCACACCCT CGTGCTGGCC GGGTAGCGAA 
GACGTTCGAT TTGTCGCCCG GGGCATGCCG GTCACCGACA TGGACTGGGA GATCGATCCT 
TCCGGCCTGG TCGAGACGTT GCAGCGGGTG TACGAGGAGT ACACCGACCT GCCGCTCTAC 
GTCACCGAGA ACGGTTCGGC CTTCGTAGAC GCGGTCGTTG ACGGGAAGGT GGACGACCCG 
GACCGCGTCG CCTACTTCGA GGCGCACCTA CGCGCCGCAC ACCAGGCGAT CGCCGCGGGT 
GTTCCGCTGC GCGGCTACTT CGCCTGGTCG TTGATGGATA ACTTCGAGTG GGCCTGGGGC 
TACACGAAGC GGTTCGGCAT GATCCACGTC GACTACCGCA GTCAGGCCCG CACCCTGAAA 
TCCAGCGGTC GGTGGTACGC CGAGACCATC CGACGTAACG GTCTGGCCGC ACAATAG

Protein sequence

MSNPASPPAV GVLAERPPLA FPPGFLWGAA TAAYQIEGAA TAGGRTPSIW DTFSHTPGRV 
VAGHTGDVAC DHYHRLDSDV ALMAELGLRS YRFSVSWPRV QPGGTGPINQ EGLDFYRRLV 
DQLLANGIEP WLTLYHWDLP QPLEDAGGWP ARDTAARFAD YAALVAGALG DRVRYWTTLN 
EPWCSAFLGY GSGAHAPGRS DPAAAVRAGH HLLLGHGLAV PALRAAAQSE VEIGVTLNLY 
PVTPATDSPG DADAARRIDG LANRFFLDPL LRGSYPADLM SDLRQVSDFG HVRAGDLATI 
AAPLDLVGIN YYSRHVVAAP TAAAPPEPYW RTPSCWPGSE DVRFVARGMP VTDMDWEIDP 
SGLVETLQRV YEEYTDLPLY VTENGSAFVD AVVDGKVDDP DRVAYFEAHL RAAHQAIAAG 
VPLRGYFAWS LMDNFEWAWG YTKRFGMIHV DYRSQARTLK SSGRWYAETI RRNGLAAQ