Gene Sala_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1014
Symbol
ID	4081702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1042291
End bp	1044609
Gene Length	2319 bp
Protein Length	772 aa
Translation table	11
GC content	64%
IMG OID	638009374
Product	glycoside hydrolase family protein
Protein accession	YP_616064
Protein GI	103486503
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.285084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGA TTTCGCGCAA TCTGACAAGC GCCACGCTCG CCACGCTGCT GGTGGCCGGC 
TCGCTGGCCC CCGCCCCGCT GACCGCCGCC CCCGCGGCGA CCGCCAGCGA CAAGGCGCCG 
GTCGATGCCG CGAGCTGGCA GCGCGCCGAC CCCGCGATGG ACCGCTTCAT CGCCGATCTG 
ATGGTGAAGA TGACGCTCGA CGAAAAGACC GGCCAGCTCA CGCTGCTCAC GAGCAACTGG 
GAGTCGACCG GCCCGACGAT GCGCGACAGT TACAAGGAGG ATATTCGCGC CGGGCGTGTC 
GGGGCGATCT TCAACGCCTA CACCGCCAAA TATACGCGCG AACTGCAAGC GCTTGCGGTC 
GAGGGAACGC GCCTCAAAAT CCCCCTGCTC TTCGGCTATG ACGTGATCCA CGGCCACCGG 
ACGATCTTTC CCATCTCGCT CGGCGAAGCG GCGAGCTGGG ACCTGCAGGC GATTGAAAAA 
GCCGCTCGAA TCTCGGCCAT CGAGGCATCG GCCGAGGGCA TCCACTGGAC CTTCTCACCC 
ATGGTCGACA TCGCGCGCGA TCCGCGCTGG GGTCGCATTT CCGAAGGCGC GGGCGAGGAT 
GTCTATCTCG GCAGCCTGAT CGCAAAGGCG CGCGTGCGCG GCTATCAGGG CGGCGACCTG 
TCGCGGCCCG ACACGATCCT GGCGACCGCC AAGCATTTTG CCGCCTATGG CGCGGCGCAG 
GCGGGACGCG ATTACCACAC GGTCGACATT TCGGAGCGCA CGATGCGCGA TGTCTATCTG 
CCGCCATTCA AGGCCGCGGC CGACGCGGGG GCAGCGACCT TCATGACCGC ATTCAACGAA 
TATGACGGTG TCCCGGCGTC GGGGAGCCAC TATCTGCTCA CCGACGTGCT GCGCAAGAAA 
TGGGGCTTCA AAGGCTTTGT CGTAACCGAT TACACGTCGA TCAACGAAAT GGTCCCGCAC 
GGCTATGCGA AGGATCTGAA GCAGGCAGGC GAGCAGGCGA TGCGCGCCGG AGTCGACATG 
GACATGCAAG GTGCGGTTTT CATGGAAAAC CTCGCCAAAT CGGTCGCCGA GGGCAAGGTC 
GACACCGCGC GCATCGACGC GGCGGTGAAG GCGATACTCG AGATGAAATA TCGCCTCGGC 
CTGTTCGACG ATCCTTATCG TTACGCCGAC GCGGCGCGCG AAAAAGCGAC GATCTACAAG 
CCCGCGTTTC TCGAAGCGGC GCGCGATGTC GCGCGCAAGT CGATCGTCCT CCTCAAGAAC 
AAGGACAATG TCCTGCCACT GGCCGCCAGC GCAAAGTCGA TCGCGGTGAT CGGCCCGCTC 
GGCAACAGCA AGGAAGATAT GATCGGCAGC TGGTCGGCCG CGGGCGACCG GCGGACGCGG 
CCGGTTACCT TGCTCGAAGG CTTGCAGGCC GGCGCCCCCA AGGGAACGAC GATCGCCTAT 
GCCAAGGGCG CGAGCTATCA TTTCGACGAT GTCGGCAAGA CCGACGGTTT TGCCGAAGCG 
CTCGCGCTTG CGGAAAAATC GGATGTCATC ATCGCCGCGA TGGGTGAACA TTGGAACATG 
ACCGGCGAGG CGGCAAGCCG CACCTCGCTT GACCTGCCGG GCAACCAGCA GGCGCTTCTC 
GAAGCGCTCG AAAAGACCGG CAAGCCGGTC ATCCTCGTGC TGATGAGCGG GCGACCGAAC 
AGCATCGAAT GGGCCGATGC CAATGTCGAT GCGATTCTGG AGGCCTGGTA TCCCGGCACG 
ATGGGGGGAC ATGCGATCGC CGACATATTG TACGGTCGCT ACAACCCGTC GGGCAAATTA 
CCGGTGACCT TTCCGCGCAC GGTCGGGCAG GTGCCGATCC ATTATGACAT GAAGAACACC 
GGTCGCCCGA TCGAACTGGG CGCGCCGGGC GCGAAATATG TCTCGCGCTA CCTCAACACG 
CCGAACACGC CGCTTTATCC CTTTGGCTAT GGCCTCAGCT ACACAAGCTT CACTTACTCG 
CCGGTCACGC TCGACAGGTC GAAAATCCGC CCCGGCGAAC CGCTGACCGC CAGCGTCACC 
GTGACCAACA GCGGCCCGCG CGACGGGGAG GAGGTGGTGC AGCTTTACGT CCGCGACCTC 
GTCGGTTCGG TGACGCGCCC GGTCAAGGAA TTGAAGGGAT TCCAGAAGAT CGGCCTGAAA 
AAGGGCGAAA CGCGCACGGT GCGCTTCACG CTGACCGACG CCGACCTCGC CTTCACGCGC 
CAGGACATGA GCTGGGGCAG CGAGCCCGGC GCGTTCAAGC TGTGGATCGG CCCCTCGTCG 
GCCGAAGGAT CCGAAGCCAG CTTCGAACTG ACCGAATAG

Protein sequence

MPPISRNLTS ATLATLLVAG SLAPAPLTAA PAATASDKAP VDAASWQRAD PAMDRFIADL 
MVKMTLDEKT GQLTLLTSNW ESTGPTMRDS YKEDIRAGRV GAIFNAYTAK YTRELQALAV 
EGTRLKIPLL FGYDVIHGHR TIFPISLGEA ASWDLQAIEK AARISAIEAS AEGIHWTFSP 
MVDIARDPRW GRISEGAGED VYLGSLIAKA RVRGYQGGDL SRPDTILATA KHFAAYGAAQ 
AGRDYHTVDI SERTMRDVYL PPFKAAADAG AATFMTAFNE YDGVPASGSH YLLTDVLRKK 
WGFKGFVVTD YTSINEMVPH GYAKDLKQAG EQAMRAGVDM DMQGAVFMEN LAKSVAEGKV 
DTARIDAAVK AILEMKYRLG LFDDPYRYAD AAREKATIYK PAFLEAARDV ARKSIVLLKN 
KDNVLPLAAS AKSIAVIGPL GNSKEDMIGS WSAAGDRRTR PVTLLEGLQA GAPKGTTIAY 
AKGASYHFDD VGKTDGFAEA LALAEKSDVI IAAMGEHWNM TGEAASRTSL DLPGNQQALL 
EALEKTGKPV ILVLMSGRPN SIEWADANVD AILEAWYPGT MGGHAIADIL YGRYNPSGKL 
PVTFPRTVGQ VPIHYDMKNT GRPIELGAPG AKYVSRYLNT PNTPLYPFGY GLSYTSFTYS 
PVTLDRSKIR PGEPLTASVT VTNSGPRDGE EVVQLYVRDL VGSVTRPVKE LKGFQKIGLK 
KGETRTVRFT LTDADLAFTR QDMSWGSEPG AFKLWIGPSS AEGSEASFEL TE