Gene SeD_A3388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3388
Symbol
ID	6872346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3256392
End bp	3257825
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	51%
IMG OID	642786391
Product	6-phospho-beta-glucosidase BglA
Protein accession	YP_002217029
Protein GI	198243256
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAAC TCACCTTGCC AAAAGATTTT TTATGGGGCG GCGCGGTTGC TGCACACCAG 
GTTGAAGGCG GCTGGAATAA AGACGGTAAA GGCCCCAGCA TCTGCGACGT GCTAACCGGC 
GGCGCACACG GCGTGCCACG CGAAATCACC CAGAATGTCG TTGCTGGCAA ATACTATCCG 
AACCACGAGG CGGTGGATTT TTACGGACAT TACAAAGAAG ACATCCGTCT TTTCGCCGAA 
ATGGGGTTCA AATGCTTCCG TACCTCTATT GCCTGGACGC GTATCTTCCC GAATGGCGAC 
GAATCCCAGC CAAACGAGGC CGGTCTGAAA TTCTACGACG ACATGTTTGA TGAGTTACTC 
AAATACAACA TCGAACCGGT CATTACCCTT TCTCACTTTG AAATGCCATT ACATCTGGTA 
CAGCACTACG GCGGCTGGAC CAATCGTAAG GTCGTTGATT TCTTTGTCCG TTTTGCTGAA 
GTCGTGTTTG AACGCTACAA ACATAAGGTC AAATACTGGA TGACCTTCAA TGAAATCAAC 
AATCAGCGAA ACTGGCGCGC GCCGCTGTTT GGCTACTGCT GTTCCGGCGT AGTGTATACC 
GAGCATGAGA ATCCAGAAGA AACCATGTAT CAGGTCTTAC ATCATCAGTT TGTCGCCAGC 
GCGCTGGCGG TAAAAGCGGC ACGTCGTATT AATCCACAGA TGAAAGTGGG TTGTATGCTG 
GCGATGGTCG CGCTGTATCC TTTCTCCTGT AAACCAGAAG ATGTGATGTT TGCTCAGGAG 
TCGATGCGTG AACGCTACGT CTTTACCGAT GTGCAGCTGC GCGGCTATTA CCCGTCCTAT 
GTGTTGAACG AGTGGGAGCG CCGCGGATTT AACATCAAAA TGGAAGATGG CGATCTTGAA 
GTGCTGCGCG AAGGCACCTG CGATTATCTT GGTTTCAGTT ATTACATGAC CAACGCGGTC 
AAAGCCGAAG GCGGTAGCGG CGATGCGATT TCCGGTTTTG AAGGCAGCGT ACCGAACCCC 
TATGTTAAAG CATCTGACTG GGGCTGGCAG ATTGACCCGG TGGGCCTGCG TTATTCATTG 
TGTGAACTGT ACGAACGCTA TCAAAAGCCG CTGTTTATTG TCGAAAACGG TTTTGGTGCT 
TACGACAAAG TAGAAGAAGA TGGCAGCATC AACGACGACT ACCGAATTGA CTACCTGCGC 
GCCCATATTG AAGAGATGAA AAAAGCGGTG ACTTACGATG GTGTCGACCT GATGGGCTAC 
ACGCCGTGGG GCTGCATCGA CTGCGTGTCG TTCACCACCG GTCAGTACAG CAAGCGCTAC 
GGCTTCATCT ACGTGAACAA GCACGATGAC GGTACGGGCG ATATGTCGCG TTCGCGTAAG 
AAAAGCTTCA ACTGGTACAA AGAGGTGATT GCCAGCAACG GCGAGAAGCT TTAA

Protein sequence

MRKLTLPKDF LWGGAVAAHQ VEGGWNKDGK GPSICDVLTG GAHGVPREIT QNVVAGKYYP 
NHEAVDFYGH YKEDIRLFAE MGFKCFRTSI AWTRIFPNGD ESQPNEAGLK FYDDMFDELL 
KYNIEPVITL SHFEMPLHLV QHYGGWTNRK VVDFFVRFAE VVFERYKHKV KYWMTFNEIN 
NQRNWRAPLF GYCCSGVVYT EHENPEETMY QVLHHQFVAS ALAVKAARRI NPQMKVGCML 
AMVALYPFSC KPEDVMFAQE SMRERYVFTD VQLRGYYPSY VLNEWERRGF NIKMEDGDLE 
VLREGTCDYL GFSYYMTNAV KAEGGSGDAI SGFEGSVPNP YVKASDWGWQ IDPVGLRYSL 
CELYERYQKP LFIVENGFGA YDKVEEDGSI NDDYRIDYLR AHIEEMKKAV TYDGVDLMGY 
TPWGCIDCVS FTTGQYSKRY GFIYVNKHDD GTGDMSRSRK KSFNWYKEVI ASNGEKL