Gene Sama_1402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1402
Symbol
ID	4603654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	1701207
End bp	1702565
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	54%
IMG OID	639780752
Product	Beta-glucosidase
Protein accession	YP_927279
Protein GI	119774539
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00588198
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0441628
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAC TCTCGCATTT CACCCTGCCG GGCGATTCAG TAATGATGCA AAAAGATTTT 
TTATTTGGCG TCGCCACCGC CTCGTTTCAA ATTGAAGGCG ACGCTGAACA TCGTCAGCCC 
TGTATCTGGG ACACCTTTTG CGATACCCCA GGCAAAATTG CGGATGGTTC GAACGGTCAG 
GTTGCCTGCG ATCATGTCAA GCTCTGGCGT GACGATGTTG ACCTGATTGC CTCCCTTGGG 
GTGGATGCCT ACCGCCTGTC CATCAGTTGG GGACGGGTGT TACATCCCGA TGGCAGTGTG 
AACCAGCGCG GCATGGATTT TTACATTAAT CTCCTGGATG AGCTTGGTCG CCGGGGCATT 
AACGTGTTCG TCACCCTCTA CCACTGGGAC TTACCTCAGC ATCTTGAGGA CAAAGGTGGC 
TGGCTCAATC GTGACACAGC AGTGGCCTTT GCCAACTACG CCGCCATTGT GGCCAACGCC 
CTGGGTAACA GGGTGTATGC CTATTCAACC CTGAATGAGC CATTTTGCAG CGCCTTTCTC 
GGCTATGAGG CAGGTATTCA CGCTCCCGGC CACAAGAGCC GTCAGCAGGG CCGCACAGCC 
GCCCACAATT TGCTGCTGGC CCACGGTATG GCAATGACTG AAATTCGACG GGAAGCACCA 
GAGGCCAAAG CGGGCATAGT GCTTAATTTC AGCCCGGCTT ATCCCTACAC ATCCAGTGCC 
GGGGATGCCA ACGCCGCCCG ACTGGCCCAT GAATATCACA ACACCTGGTA CTTGATGCCA 
CTGATGGAAG GCCGTTATCC GGACATCATC AATCAACTCG AGCCCCATGA ACGCCCGGTT 
GTGGAGCCCG GTGATATGGA TATCATCAGT ACACCAATCG ATTATCTGGG GATCAACTAC 
TATACCCGTA ACGTCTACCG CGCTGGCGGC CCGCTTGGCT TTGAAGAAGT GCGTATCGAT 
AACGTGCCCC GTACCGCCAT GGATTGGGAA ATTTGCCCCC AGGCCTTTAC CGACTTGCTG 
ACAGGTCTGG CACAGGAATT TAACCTGCCA CCAATTTACA TCACTGAAAA TGGCGCTGCC 
GAAGACGATG CGCCATTTAA CGGCACTGTG CACGACCCCA TGCGACTGGA CTATTTGCAG 
TCTCATCTGC TGGCTGTTCA TCAGGCTATC GAACGCGGAG TGGATATCAA AGGCTACTTT 
GCCTGGAGTC TGATGGACAA CTTTGAGTGG GCGGAAGGCT ACCGCAAACG CTTTGGACTG 
GTCTATGTCG ACTATGGGAC CCAGCAGCGC ATACTCAAAT CCAGCGCCAA AGCCTATCAG 
GGAATGCTTG CCATACGCCA AGAGGCCAGC CAACAATAA

Protein sequence

MTTLSHFTLP GDSVMMQKDF LFGVATASFQ IEGDAEHRQP CIWDTFCDTP GKIADGSNGQ 
VACDHVKLWR DDVDLIASLG VDAYRLSISW GRVLHPDGSV NQRGMDFYIN LLDELGRRGI 
NVFVTLYHWD LPQHLEDKGG WLNRDTAVAF ANYAAIVANA LGNRVYAYST LNEPFCSAFL 
GYEAGIHAPG HKSRQQGRTA AHNLLLAHGM AMTEIRREAP EAKAGIVLNF SPAYPYTSSA 
GDANAARLAH EYHNTWYLMP LMEGRYPDII NQLEPHERPV VEPGDMDIIS TPIDYLGINY 
YTRNVYRAGG PLGFEEVRID NVPRTAMDWE ICPQAFTDLL TGLAQEFNLP PIYITENGAA 
EDDAPFNGTV HDPMRLDYLQ SHLLAVHQAI ERGVDIKGYF AWSLMDNFEW AEGYRKRFGL 
VYVDYGTQQR ILKSSAKAYQ GMLAIRQEAS QQ