Gene Smed_2786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2786
Symbol
ID	5323656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2903962
End bp	2905368
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	61%
IMG OID	640791731
Product	Beta-glucosidase
Protein accession	YP_001328451
Protein GI	150397984
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAAG CCAAGAAACT GGCAGAGCGC TTTCCCGGCG ATTTTGTCTT CGGCGTTGCC 
ACCGCATCCT TCCAGATCGA GGGAGCGAGC AAGGCGGATG GGCGCAAAGC CTCCATCTGG 
GATGCCTTCT CCAATATGCC GGGCCGTGTT TACGGACGCC ATAATGGCGA TGTCGCCTGC 
GACCATTACA ACAGGCTGGA ACAGGACCTC GACCTGATAA AGAGCCTTGG CGTCGGGGCC 
TATCGCTTCT CGATCGCCTG GCCGAGGATC GTTCCGGAGG GCACCGGCCC GATCAACGAG 
AAGGGGCTCG ACTTCTACGA TCGCCTCGTC GATGGGCTGA AGGCGCGCGG CATCAAGGCC 
TTCGCCACGC TCTATCACTG GGACCTGCCG CTGGCGCTGA TGGGCGACGG CGGCTGGACG 
GCGCGCACGA CGGCTTATGC CTATCAGCGC TACGCGAAAA CGGTGGTTGC GCGTGTCGGC 
GACCGTCTCG ACGCGGTGGC GACTTTCAAC GAACCCTGGT GTTCAGTCTG GCTAGGCCAT 
CTTTACGGCG TGCATGCGCC GGGTGAACGC AACATGGATG CGGCACTTGC CGCGCTGCAC 
GTCACCAATC TCGCCCATGG GTTAGGCGTG TCCGCGATCC GTTCGGTAAG GGCGGACCTG 
CCGGTGGGCA TCGTCATCAA TGCCCATTCA ATCTATGCCG GCAGCGGCAG CGCCGCGGAC 
AAGGCCGCGG CCGAACGCGC CTTCGATTTC CACAACGGCG TTTTTTTCGG CCCTGTCTTC 
AAAGGCGAAT ATCCGGAGGG TTTCCTCTCG GCGCTTGGCG ACCGCATGCC AGCAATCGAG 
GACGGCGACA TGGAGACGAT CGCCCAGCCG CTCGACTGGT GGGGGCTCAA CTACTATACG 
CCGATGCGCG TTTCGGCAGA CTCCGCGAAG GATTCAGAAT ACCCGGCGAC CGTCAATGCG 
AAGCCCATGA GCGACGTGAA GACGGATATC GGCTGGGAAG TCTACGCTCC GGCGCTTGGC 
GCGTTGGTGG AGACGCTCAA TGCCCGCTAT GCGCTTCCCG ACTGCTACAT CACCGAGAAC 
GGCGCCTGCT ACAATATGGA CGACGAGAAT GGCGTCGTCG ACGATCAGCC TCGGCTCGAC 
TATATCTCGG ACCATCTCGC AGTTGCCGCC GATCTCATCT CCAGGGGGTA TCCTATGAAG 
GGCTATTTCG CCTGGAGCCT GATGGACAAT TTCGAGTGGG CGGAGGGCTA CAGGATGCGC 
TTCGGCATCG TTCACGTTGA TTATGAAACT CAGGTCCGCA CGATCAAGAA AAGCGGCCGC 
TGGTACGAAG CCCTGGCGAA GCAGTTCCCC AGGACAACCG TAAACAGGGA AGATGCCGCG 
CCACGGCGTT CTGTACAGAA AGAGTAG

Protein sequence

MIEAKKLAER FPGDFVFGVA TASFQIEGAS KADGRKASIW DAFSNMPGRV YGRHNGDVAC 
DHYNRLEQDL DLIKSLGVGA YRFSIAWPRI VPEGTGPINE KGLDFYDRLV DGLKARGIKA 
FATLYHWDLP LALMGDGGWT ARTTAYAYQR YAKTVVARVG DRLDAVATFN EPWCSVWLGH 
LYGVHAPGER NMDAALAALH VTNLAHGLGV SAIRSVRADL PVGIVINAHS IYAGSGSAAD 
KAAAERAFDF HNGVFFGPVF KGEYPEGFLS ALGDRMPAIE DGDMETIAQP LDWWGLNYYT 
PMRVSADSAK DSEYPATVNA KPMSDVKTDI GWEVYAPALG ALVETLNARY ALPDCYITEN 
GACYNMDDEN GVVDDQPRLD YISDHLAVAA DLISRGYPMK GYFAWSLMDN FEWAEGYRMR 
FGIVHVDYET QVRTIKKSGR WYEALAKQFP RTTVNREDAA PRRSVQKE