Gene Strop_3384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3384
Symbol
ID	5059851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3882858
End bp	3884585
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	73%
IMG OID	640475633
Product	glycoside hydrolase family 3 protein
Protein accession	YP_001160195
Protein GI	145595898
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGATAC CTTCACGACG CGGCGGTGTC GCGGTCATCG CGCTGGCCGC ACTCACCGCC 
CTGCTTCTTG CCGGCTGCAC CGGCGGTCCG GGGCGCGCAC AGCCGACACC GGCGGCGAGG 
GGCTCGGCGA CCGGCTCGTC GCCCGTGGGC CCGGTTCAGG ATCCGGTGGC CAGCGCCGCG 
GCCCTGGTCA ACTCGCTGGC GGATGAGGAC CTCGTCGGAC AGGTGTTGAT GCCCTACGCC 
TACGGTGCCG CCGCCGATCA GGTCTCGACC GGTTCGGCCG CCGGCAACCA GGAGCTGGCC 
GGCGTCGACA CCCCCGCCCA GATGATCGCG AAGTACCGCC TCGGCGGGCT CATCCTCGTC 
GGCTTCAGCG CGGACGACCC GACCAGCGGC AACCAGGAGA CCACCAACGT CGACAACCCG 
GAACAGGTCC GGGCGCTGAC CACCGGGCTG CGGTCCGCCG CTGCCGACCT GGCCACCGGT 
GCGGCGCCGT TCCTGATCGG CACCGACCAG GAGTACGGAG TGGTCACCCG GATCACCGAC 
GGGGTCACCA TGTTGCCCAG CGCGTTGGCC ACGGGGGCGG CCGGCAAGCC TGAGCTGACC 
GAGTCCGCCT GGCGGGCTGC CGGCACCGAA CTGGCCGCGA TGGGCGTCAA CGTGGACTTC 
GCTCCCGTCG CCGACGTGCT TGTCACCCCC AGCACCGTGA TCGGGTCCCG GTCGTACGGC 
GCCGACCCGT CGATGGTGGC CGAGCAGGTC AGTGGGGTGG TGCGCGGTCT GCAGGCGACC 
GGCGTCGCGG CGACCCTGAA GCATTTTCCC GGCCACGGGC ACAGCGCCAC CGACTCCCAC 
GAGGCGCTGC CGGTGCTGCC GCAGCCGCGC ACCGTGCTCG AGCTGGAGGC CTGGCGTCCC 
TTCGCGGCCG GCATCGGGGC CGGCGCCCTC GCCGTGATGT CCGGGCACCT CGACGTCCGG 
GCAGTCGACC CGGGCACCCC GGCAACGTTC TCGCACACCC TGCTTACCGA GGTGCTCCGC 
GGCGAGCTCG GCTTTCAGGG AGTGGTGATC ACCGACGGGA TGAACATGGC CCCCGCCAAA 
CGATGGTCGC CCGGTGAGGC CGCGGTCCGT GCCCTGAAGG CCGGCAACGA CCTGATCCTC 
ATGCCGCCGC ACGTCGGCCA GGCGTATGAC GGGCTGCTCG CCGCGCTGCG CGACGGCTCG 
CTGCCCCGGA CCCGGCTGGT GGAGGCGGTG ACCCGGGTGC TGACCATGAA GTTCACTCTG 
GCCGGTGCGG CCGTCCCGGA ACTGGATGTC GTCGGCGCGC CGGCCCACCA GGCGGCGGCC 
GTCGAGCTTG CCACCGCCGC GGTGACCGCG CTGCGTGGCC CGTGTGGCAG CCCGGTCTCC 
GGGCCGGTGA CCGTGACCGC CTCCACTGGC CGGGAACACA CCCGGGCGAC GCTGATCAAG 
AAGCTGACCG CGGCCGGGGT GCCGGTTGCC GACAGCGGCG GTGCCGTGGT CCACCTGGTC 
GGCTACGGCG ACAGCGCCGA CGACCTGAGC GCCGACGCCG CCGTGACCGT TGCCATGGAT 
ACCCCGTACC TGTTGGCCGA GGCGGACTCC CCGGCGTTGC TGGCAACCTA CTCGTCGAGC 
CCGGCGTCGA TGACCGGACT GGCCCAGGTG CTGGCTGGCG AGGCCACTCC GGCCGGCAGC 
GCACCGGTGC CGGTCTCCGG CCTGCCCGCC ACGACCTGCG GCAGCTGA

Protein sequence

MSIPSRRGGV AVIALAALTA LLLAGCTGGP GRAQPTPAAR GSATGSSPVG PVQDPVASAA 
ALVNSLADED LVGQVLMPYA YGAAADQVST GSAAGNQELA GVDTPAQMIA KYRLGGLILV 
GFSADDPTSG NQETTNVDNP EQVRALTTGL RSAAADLATG AAPFLIGTDQ EYGVVTRITD 
GVTMLPSALA TGAAGKPELT ESAWRAAGTE LAAMGVNVDF APVADVLVTP STVIGSRSYG 
ADPSMVAEQV SGVVRGLQAT GVAATLKHFP GHGHSATDSH EALPVLPQPR TVLELEAWRP 
FAAGIGAGAL AVMSGHLDVR AVDPGTPATF SHTLLTEVLR GELGFQGVVI TDGMNMAPAK 
RWSPGEAAVR ALKAGNDLIL MPPHVGQAYD GLLAALRDGS LPRTRLVEAV TRVLTMKFTL 
AGAAVPELDV VGAPAHQAAA VELATAAVTA LRGPCGSPVS GPVTVTASTG REHTRATLIK 
KLTAAGVPVA DSGGAVVHLV GYGDSADDLS ADAAVTVAMD TPYLLAEADS PALLATYSSS 
PASMTGLAQV LAGEATPAGS APVPVSGLPA TTCGS