Gene SeD_A2028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2028
Symbol
ID	6870996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1961328
End bp	1962683
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	48%
IMG OID	642785142
Product	6-phospho-beta-glucosidase
Protein accession	YP_002215808
Protein GI	198246086
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA AATTAAAAGT CGTCACTATT GGTGGCGGGA GCAGCTACAC CCCTGAATTA 
CTTGAAGGCT TTATTAAACG CTACCATGAA TTACCTGTCA CTGAATTATG GCTGGTTGAC 
GTTGAAGACG GGAAAGAGAA GCTGGGCATT ATTTATGATC TCTGCCAGCG AATGATTGAT 
AAAGCAGGCG TTCCGCTAAA ATTGTATAAA ACGCTGGATC GCCGGGAAGC GCTGAAAGAC 
GCTAATTTTG TTACTACCCA GCTACGCGTT GGTCAACTCA AAGCCCGTGA ACTGGACGAG 
CGTATCCCGC TTAGTCACGG CTATCTGGGG CAAGAAACCA ACGGCGCTGG CGGTTTATTT 
AAAGGGTTGC GTACCATTCC GGTTATTTTT GACATCATTA AGGATGTTGA AGAATTATGT 
CCGAATGCGT GGGTCATTAA CTTTACTAAT CCGGCAGGGA TGGTGACGGA AGCGGTTTAT 
CGTCATACCA ACTTTAAAAA GTTCATTGGC GTATGTAATA TTCCTGTCGG CATGAAAATG 
TTTATTCATG ACGTGCTGGC GCTGAATGAG ACTGACGATC TTTCCATTGA CCTGTTTGGT 
CTAAACCATA TGGTCTTTAT TAAAGATGTG CTGGTGAATG GCACCTCACG GTTCGCAGAA 
TTACTGGATG GCGTGGCGCC CGGTCAGTTG AAAGCGTCAA CCGTAAAAAA TATCTTTGAT 
CTGCCGTTTA GTGAAGGATT GATTCGCTCG CTGAACATGC TGCCGTGCTC TTATTTGTTG 
TATTACTTCA AGCAAAAAGA GATGTTGGCG ATTGAAATGG GCGAATATTA CAAAGGCGGC 
GCGCGCGCTC AGGTCGTACA AAAAGTGGAG AAACAACTCT TCGACTTGTA CAAAAATCCT 
GAGCTAAACG TGAAGCCGAA AGAGCTTGAG CAACGCGGCG GCGCTTATTA TTCCGATGCC 
GCTTGTGAAG TCATTAACGC TATTTATAAT GACAAGCAGA CTGAGCATTA CGTTAATATT 
CCACATCATG GGCATGTCGA GAATATCCCG GCGGACTGGG CGGTGGAAAT GACCTGCATT 
CTGGGACGCA ATGGCGCGAC GCCGCACCCG CGTATCACCC GTTTTGACGA AAAAGTGCTG 
GGGCTTATCC ACACTATTAA AGGATTTGAG GTCGCGGCCA GCAATGCGGC GCTGAGCGGA 
AACTTTAATG ATGTGCTGCT GGCGCTTAAC CTGAGTCCGC TGGTGCATTC CGACCGCGAC 
GCAGAAGTCC TGGCGCGTGA GCTCATTCTG GCGCATGAAA AATGGCTGCC TAATTTTGCC 
GCTTGCATCG AAGCGCTTAA AGGTAAGCAC CACTGA

Protein sequence

MSQKLKVVTI GGGSSYTPEL LEGFIKRYHE LPVTELWLVD VEDGKEKLGI IYDLCQRMID 
KAGVPLKLYK TLDRREALKD ANFVTTQLRV GQLKARELDE RIPLSHGYLG QETNGAGGLF 
KGLRTIPVIF DIIKDVEELC PNAWVINFTN PAGMVTEAVY RHTNFKKFIG VCNIPVGMKM 
FIHDVLALNE TDDLSIDLFG LNHMVFIKDV LVNGTSRFAE LLDGVAPGQL KASTVKNIFD 
LPFSEGLIRS LNMLPCSYLL YYFKQKEMLA IEMGEYYKGG ARAQVVQKVE KQLFDLYKNP 
ELNVKPKELE QRGGAYYSDA ACEVINAIYN DKQTEHYVNI PHHGHVENIP ADWAVEMTCI 
LGRNGATPHP RITRFDEKVL GLIHTIKGFE VAASNAALSG NFNDVLLALN LSPLVHSDRD 
AEVLARELIL AHEKWLPNFA ACIEALKGKH H