Gene Sare_0390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0390
Symbol
ID	5705649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	449845
End bp	451248
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	71%
IMG OID	641269915
Product	Beta-glucosidase
Protein accession	YP_001535310
Protein GI	159036057
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0163066
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGAGC TTCGATTTCC TGACAACTTC CGTTGGGGTG CGGCCACGGC GGCCTACCAG 
ATCGAGGGCG CGACCCGCGA CGACGGTCGT GGGCCGTCGA TCTGGGACAC CTTCAGTCGT 
ACCCCGGGCA AGGTCCACCA GGGCCAGACC GGTGACGTCG CCTGCGACCA CTACCACCGG 
TTCGCGGACG ACGTGGAGCT GATGGCGGAA CTCGGGCTGG GCGCGTACCG GTTCTCGGTG 
TCCTGGCCTC GGGTCCAGCC GGACGGCACC GGCCCGATCA ACCCGCGAGG GCTGGACTTC 
TATGACCGCC TGGTGGACGC ACTGCTCGGG CGGGGCATCG ACCCGATCGT CACGCTGTAC 
CACTGGGACC TGCCACAGAC CCTGCAGGAC CGGGGCGGCT GGGTCACCCG GGAGACCGCG 
GAACACTTCG CCGGGTACGC CGCCGCTGTC CATGGCCGAA TCGGCGACCG GGTGGCCTCG 
TGGACGACGC TCAACGAGCC GTGGTGCTCG GCCTACCTGG GCTACGGCAA CGGGGTGCAC 
GCCCCGGGGA TACAGGACCC GGGCGCGGCG TTCACCGCGG TCCACCACCT GCTCCTCGGG 
CACGGCCTGG CGGCCCGGGC GCTGCGCACG GCCGGTGCGG GGACCGTTGG GATCACGCTG 
AACCCGGCCG ACGTCCGTCC CGCCGACCCG GACAGCGCCG CCGACGCCGC GGCGGTACGC 
CTGGTCGACG GGCTCCAGAA CCGGATCTTC CTGGACCCGT TGTTCCGGGC CGCCTACCCG 
GTGGACGTAC TCGAGCACAT CGCCCGCATC GTGCCGCCGG CGTTCATTCG CGACGGCGAC 
GAGAAGCTGA TCGCCACACC GATCGACCTG CTCGGCGTCA ACTACTACAC CCCCACCTAC 
GTCGCGGGAA GGCCGGACGG TGCCGGCGGC GGTGGCGCGT TTCCCGGCAC CGACGGTGCG 
GTGGAGTTCC TGCCTCCCAC CGGGCCGCTG ACCGACATGG GCTGGATGAT CGAGCCGGCC 
GGGCTTACCC GGATGCTGGA GCGCCTCGCC GCCGACTACC CGGGCGTGCC ACTGCTGATC 
ACCGAGAACG GGGCGGCGTT CCCGGACCGA GCCGGCGCGG AAGGGGTCGG CGCGGACCGA 
ACCGAGGCGG AGGGGGCCGG CCCGGTGGCC GACACGGACC GGATCGCGTA CCTCGACGCG 
CACCTACGCG CGGCGCACAC CGCCATCGCC CGCGGTGTGG ACCTACGCGG CTATCTCGTA 
TGGTCACTGC TGGACAACTT TGAGTGGGCC GAGGGCTACC GGAAGCGGTT CGGGATCGTC 
CACGTCGACT ACCTGACCCA GCGGCGCACA CCGAAGGCGA GTGCCCGCTG GTACCAGGAG 
GTGATCTCCC GGAACGGGCT GTGA

Protein sequence

MSELRFPDNF RWGAATAAYQ IEGATRDDGR GPSIWDTFSR TPGKVHQGQT GDVACDHYHR 
FADDVELMAE LGLGAYRFSV SWPRVQPDGT GPINPRGLDF YDRLVDALLG RGIDPIVTLY 
HWDLPQTLQD RGGWVTRETA EHFAGYAAAV HGRIGDRVAS WTTLNEPWCS AYLGYGNGVH 
APGIQDPGAA FTAVHHLLLG HGLAARALRT AGAGTVGITL NPADVRPADP DSAADAAAVR 
LVDGLQNRIF LDPLFRAAYP VDVLEHIARI VPPAFIRDGD EKLIATPIDL LGVNYYTPTY 
VAGRPDGAGG GGAFPGTDGA VEFLPPTGPL TDMGWMIEPA GLTRMLERLA ADYPGVPLLI 
TENGAAFPDR AGAEGVGADR TEAEGAGPVA DTDRIAYLDA HLRAAHTAIA RGVDLRGYLV 
WSLLDNFEWA EGYRKRFGIV HVDYLTQRRT PKASARWYQE VISRNGL