Gene SNSL254_A4055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4055
Symbol
ID	6485832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3945303
End bp	3946685
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	54%
IMG OID	642739313
Product	beta-glucosidase
Protein accession	YP_002043022
Protein GI	194446382
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0966548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.0647863
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATACC GTTTTCCCGA TAACTTCTGG TGGGGCAGCG CCTGCTCAGC GTTGCAAACC 
GAAGGGGATA GTCTGAATGG CGGTAAAAGC CAGACCACGT GGGATGTGTG GTTCGAGCGC 
CAGCCTGATC GTTTTCACCA GGGCGTCGGT CCAGCGGAAA CCTCAACGTT CTATCGCCAC 
TGGAAGCAAG ACATCGCGCT ACTGAAACAG TTAAAACATA ACAGTTTTCG CACCTCGCTA 
AGCTGGGCGC GGCTCATTCC AGACGGCGTA GGCGAGGTGA ATCCACAAGC GGTGAGCTTC 
TACAATCACG TCATCGACGA GCTACTGGCG CAGGGCATCA CGCCGTTTAT TACGCTGTTC 
CATTTTGATA TGCCGATGGT CATGCAGGAG AAAGGCGGCT GGGAAAATCG CGACGTCGTA 
GAGGCGTTTG GTCGGTACGC GCAAACGTGT TTTACCTTGT TTGGCGACCG CGTGAAGCAC 
TGGTTTACCT TTAACGAGCC GATTGTGCCG GTGGAGGGCG GCTATTTGTA CGACTTCCAC 
TATCCCAATG TGGTGGATTT TAAACGTGCG GCCACCGTGG CGTACCATAC CGTGCTGGCG 
CACTCGACCG CCGTGCGCGC CTGGCGCGCC GGGCGCTACG ACGGTGAAAT CGGCGTAGTG 
CTGAATCTGA CGCCGTCCTA CCCACGCTCG CAGCATCCCG CCGATGTGCA AGCCGCGCAT 
CATGCGGATC TGTTATTCAA CCGCAGTTTT CTTGACCCGG TATTAAAGGG AGAATACCCG 
GCGGACTTGG TGGCGCTGCT GAAAACCTAT GACCAGCTGC CTGCCTGTCA GCCAGGCGAC 
CGTCAGCTTA TTGCCGACGG CAAAATCGAT TTACTGGGGA TTAACTATTA TCAGCCGCGC 
CGCGTGAAAT GCCGTGATAC GGCGGTGAAT CCGCAAGCGC CGTTTATGCC GGAATGGTTA 
TTTGACTATT ACGACATGCC GGGGCGCAAG ATGAACCCTT ACCGCGGCTG GGAAATTTAC 
GCGCCAGGAA TTTACGACAT CATCACCAAC CTGCGGGATA ATTACGGCAA TCCGCGCTGT 
TTTATCTCCG AAAACGGGAT GGGCGTTGAG AACGAGCAGC GTTTTGTGCA AGCGGGACAG 
ATTCACGATG ATTACCGGAT TGACTTTATC TCTGAGCATC TTAAATGGCT GCATAAAGGC 
ATTAGCGAGG GCTGTCACTG TCTTGGCTAC CACATGTGGA CCTTTATCGA TAACTGGTCA 
TGGCTGAACG GCTATAAAAA TCGCTATGGT TTTGTACAAC TGGATTTAGC CACCCAAACG 
CGCACGGTGA AAAAAAGCGG AGAATGGTTT GCCGCCACCG CAGAGCATAA CGGTTTTGAT 
TAA

Protein sequence

MRYRFPDNFW WGSACSALQT EGDSLNGGKS QTTWDVWFER QPDRFHQGVG PAETSTFYRH 
WKQDIALLKQ LKHNSFRTSL SWARLIPDGV GEVNPQAVSF YNHVIDELLA QGITPFITLF 
HFDMPMVMQE KGGWENRDVV EAFGRYAQTC FTLFGDRVKH WFTFNEPIVP VEGGYLYDFH 
YPNVVDFKRA ATVAYHTVLA HSTAVRAWRA GRYDGEIGVV LNLTPSYPRS QHPADVQAAH 
HADLLFNRSF LDPVLKGEYP ADLVALLKTY DQLPACQPGD RQLIADGKID LLGINYYQPR 
RVKCRDTAVN PQAPFMPEWL FDYYDMPGRK MNPYRGWEIY APGIYDIITN LRDNYGNPRC 
FISENGMGVE NEQRFVQAGQ IHDDYRIDFI SEHLKWLHKG ISEGCHCLGY HMWTFIDNWS 
WLNGYKNRYG FVQLDLATQT RTVKKSGEWF AATAEHNGFD