Gene SNSL254_A1430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1430
Symbol
ID	6485263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1396914
End bp	1398269
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	48%
IMG OID	642736822
Product	6-phospho-beta-glucosidase
Protein accession	YP_002040576
Protein GI	194445776
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA AATTAAAAGT CGTCACTATT GGTGGCGGGA GCAGCTACAC CCCTGAATTA 
CTTGAAGGCT TTATTAAGCG CTACCATGAA TTACCTGTCA CCGAATTATG GCTGGTTGAC 
GTTGAAGACG GGAAAGAGAA GCTGGGCATT ATTTATGATC TCTGCCAGCG AATGATTGAT 
AAAGCAGGCG TTCCGCTAAA ATTGTATAAA ACGCTGGATC GCCGGGAAGC GCTGAAAGGC 
GCTAATTTTG TCACTACCCA GCTACGCGTT GGTCAACTCA AAGCCCGTGA GCTGGACGAG 
CGTATCCCGC TTAGCCACGG CTATCTGGGG CAAGAAACCA ACGGCGCTGG CGGTTTATTT 
AAAGGGTTGC GTACCATTCC GGTTATTTTT GACATCATTA AGGATGTTGA AGAATTATGT 
CCGAATGCGT GGGTCATTAA CTTTACTAAC CCGGCGGGGA TGGTGACGGA AGCGGTTTAT 
CGTCATACCA ACTTTAAAAA GTTCATTGGC GTATGTAATA TTCCTGTCGG CATGAAAATG 
TTTATTCATG ACGTGCTGGC GCTGAATGAG AATGACGATC TCTCCATTGA CCTGTTTGGT 
CTAAACCATA TGGTCTTTAT TAAAGACGTG CTGGTGAATG GCACCTCACG GTTCGCAGAA 
TTACTGGATG GCGTGGCGTC CGGTCAGTTG AAAGCGTCAA CCGTAAAAAA TATCTTTGAT 
CTGCCGTTTA GTGAAGGATT GATTCGCTCG CTGAACATGC TGCCGTGCTC TTATTTGTTG 
TATTACTTCA AGCAAAAAGA GATGCTGGCG ATTGAAATGG GCGAATATTA CAAAGGCGGC 
GCGCGCGCTC AGGTCGTACA AAAAGTGGAG AAACAACTCT TCGACTTGTA CAAAAATCCT 
GAGCTAAACG TGAAGCCGAA AGAGCTTGAG CAACGCGGCG GCGCTTATTA TTCCGATGCC 
GCTTGTGAAG TCATTAACGC TATTTATAAT GACAAGCAGA CTGAGCATTA CGTTAATATT 
CCACATCATG GGCATGTCGA GAATATCCCG GCGGACTGGG CGGTGGAAAT GACCTGCATT 
CTGGGACGCA ATGGCGCGAC GCCGCACCCG CGTATCACCC GTTTTGACGA AAAAGTGCTG 
GGGCTTATCC ACACTATTAA AGGATTTGAG GTCGCGGCCA GCAATGCGGC GCTGAGCGGA 
AACTTTAATG ATGTGCTGCT GGCGCTTAAC CTGAGTCCGC TGGTGCATTC CGACCGCGAC 
GCAGAAGTCC TGGCGCGTGA GCTCATTCTG GCGCATGAAA AATGGCTGCC TAATTTTGCC 
GCTTGCATCG AAGCGCTTAA AGGTAAGCAC CACTGA

Protein sequence

MSQKLKVVTI GGGSSYTPEL LEGFIKRYHE LPVTELWLVD VEDGKEKLGI IYDLCQRMID 
KAGVPLKLYK TLDRREALKG ANFVTTQLRV GQLKARELDE RIPLSHGYLG QETNGAGGLF 
KGLRTIPVIF DIIKDVEELC PNAWVINFTN PAGMVTEAVY RHTNFKKFIG VCNIPVGMKM 
FIHDVLALNE NDDLSIDLFG LNHMVFIKDV LVNGTSRFAE LLDGVASGQL KASTVKNIFD 
LPFSEGLIRS LNMLPCSYLL YYFKQKEMLA IEMGEYYKGG ARAQVVQKVE KQLFDLYKNP 
ELNVKPKELE QRGGAYYSDA ACEVINAIYN DKQTEHYVNI PHHGHVENIP ADWAVEMTCI 
LGRNGATPHP RITRFDEKVL GLIHTIKGFE VAASNAALSG NFNDVLLALN LSPLVHSDRD 
AEVLARELIL AHEKWLPNFA ACIEALKGKH H