Gene SeAg_B4001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B4001
Symbol
ID	6792629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	3900455
End bp	3901837
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	54%
IMG OID	642778118
Product	beta-glucosidase
Protein accession	YP_002148712
Protein GI	197248406
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATACC GTTTTCCCGA TAACTTCTGG TGGGGCAGCG CCTGCTCAGC GTTGCAAACC 
GAAGGGGATA GTCTGAATGG CGGTAAAAGC CAGACCACGT GGGATGTGTG GTTCGAGCGC 
CAGCCGGGTC GTTTTCATCA GGGCATCGGT CCAGCGGAAA CCTCAACGTT CTATCGCCAC 
TGGAAGCAAG ACATCGCGCT ACTGAAACAG TTAAAACACA ACAGTTTTCG CACCTCGCTA 
AGCTGGGCGC GGCTCATTCC AGACGGTGTA GGCGAGGTGA ATCCACAAGC GGTGAGCTTC 
TACAATCACG TCATCGACGA GCTACTGGCG CAGGGCATCA CGCCGTTTAT TACGCTGTTC 
CATTTTGATA TGCCGATGGT CATGCAGGAG AAAGGCGGCT GGGAAAATCG CGACGTCGTA 
GAGGCGTTTG GTCGGTACGC GCAAACGTGT TTTACCTTGT TTGGCGACCG CGTGAAGCAC 
TGGTTTACCT TTAACGAGCC GATTGTGCCG GTGGAAGGCG GCTATTTGTA CGACTTCCAC 
TATCCCAATG TGGTGGATTT TAAACGTGCG GCCACCGTGG CGTACCATAC CGTGCTGGCG 
CACTCGACCG CCGTGCGCGC CTGGCGCGCC GGGCGCTACG ACGGTGAAAT CGGCGTAGTG 
CTGAATCTGA CGCCGTCCTA CCCACGCTCG CAGCATCCCG CCGATGTGCA AGCCGCGCAT 
CATGCGGATC TGTTATTCAA CCGCAGTTTT CTTGACCCGG TATTAAAGGG AGAATACCCG 
GCGGACTTGG TGGCGCTGCT GAAAACCTAT GACCAGCTGC CTGCCTGTCA GCCAGGCGAC 
CGTCAGCTTA TTGCCGACGG CAAAATCGAT TTACTGGGGA TTAACTATTA TCAGCCGCGC 
CGCGTGAAAT GCCGTGATAC GGCGGTGAAT CCGCAAGCGC CGTTTATGCC GGAGTGGTTA 
TTTGACTATT ACGACATGCC GGGGCGCAAG ATGAACCCTT ACCGCGGCTG GGAAATTTAC 
GCGCCAGGAA TTTACGACAT CATCACCAAC CTACGGGATC ATTACGGCAA TCCGCGCTGT 
TTTATCTCCG AAAACGGGAT GGGCGTTGAG AACGAGCAGC GTTTTGTGCA AGCGGGACAG 
ATTCACGATG ATTACCGGAT TGACTTTATC TCTGAGCATC TTAAATGGCT GCATAAAGGC 
ATTAGCGAGG GCTGTCACTG TCTTGGCTAC CACATGTGGA CCTTTATCGA TAACTGGTCA 
TGGCTGAACG GCTATAAAAA TCGCTATGGT TTTGTACAAC TGGATTTAGC CACCCAAACG 
CGCACGGTGA AAAAAAGCGG AGAATGGTTT GCCGCCACCG CAGAGCATAA CGGTTTTGAT 
TAA

Protein sequence

MRYRFPDNFW WGSACSALQT EGDSLNGGKS QTTWDVWFER QPGRFHQGIG PAETSTFYRH 
WKQDIALLKQ LKHNSFRTSL SWARLIPDGV GEVNPQAVSF YNHVIDELLA QGITPFITLF 
HFDMPMVMQE KGGWENRDVV EAFGRYAQTC FTLFGDRVKH WFTFNEPIVP VEGGYLYDFH 
YPNVVDFKRA ATVAYHTVLA HSTAVRAWRA GRYDGEIGVV LNLTPSYPRS QHPADVQAAH 
HADLLFNRSF LDPVLKGEYP ADLVALLKTY DQLPACQPGD RQLIADGKID LLGINYYQPR 
RVKCRDTAVN PQAPFMPEWL FDYYDMPGRK MNPYRGWEIY APGIYDIITN LRDHYGNPRC 
FISENGMGVE NEQRFVQAGQ IHDDYRIDFI SEHLKWLHKG ISEGCHCLGY HMWTFIDNWS 
WLNGYKNRYG FVQLDLATQT RTVKKSGEWF AATAEHNGFD