Gene SeHA_C0045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0045
Symbol
ID	6488547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	43829
End bp	45868
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	55%
IMG OID	642740334
Product	glycoside hydrolase, family 31
Protein accession	YP_002044008
Protein GI	194451435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1501] Alpha-glucosidases, family 31 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTA TGCAACAAGA CCCGCGTCGT CTGGTCTGGC AGCAAAACGA TCGCTATTTA 
TGGATTGAAC CCTGGGGCGA GAACAGCCTG CGCGTACGCA GCGGCCGTCA TCTGCCGGTA 
ATGAGAAATG AAGACTGGGC ATTGACTGAG CCAGTCGCAG AAAGCCAGTG CCACATTGAT 
TATGAGCACC ACCAGGCAAC GCTGACCAAC GGCAAAATTA TCGCTATCGT CAATCAAAAA 
GGACAGGTTA CCTTTTACCG CCATCCACAC AAACCCCTGT TGCAGGAGTT CTGGCGCCTG 
CGGGGCGAAA TTGGCGAGGA TGAATCATCT CACGGCCAGT ACGTCAGCGC ACTCAACCTT 
GAGGGACGCG AGTTCCGCCC TATTCAGGGT GGGAAATATT CACTGAAAGC CCGCTTCGAA 
GCCACCGAAG GGGAAAAAAT TTATGGTATG GGGCAGTATC AACAGGCCAA CCTGGATCTC 
AAAGGATGCG TGCTTGAGCT GGCGCAACGT AACTCCCAGG CCTCAGTACC GTTTATGCTC 
TCCAGTCTGG GCTACGGATT TTTATGGAAC AACCCGGCAG TCGGACGCGT AACCTTTGCC 
CAAAACGTTA CCGAATGGGA AGCGCAGGTC AGCGAACAGC TGGACTACTG GATCACGGCT 
GGCGATACCC CGGCAGAAAT TAGCCGGGCT TACGCGCTGG CTACCGGCAC GCCGCCGATG 
ATGCCGGACT ACGCCATGGG CTTCTGGCAG TGCAAACTCC GTTATCGTAC GCAGGAAGAG 
CTGCTGGAGG TCGCCCGCGA ATATAAGCGC CGCAATCTGC CTATCTCAGT GATCGTAATC 
GACTTCTTTC ACTGGCCGAA TCAGGGTGAC TGGATGTTCG ATGCGCGCGA CTGGCCCGAT 
CCTGATGCCA TGATTGCCGA GCTGAAATCG CTGGGAATTG AGCTGATGGT CTCCGTCTGG 
CCGACGGTGG ATAACCGTAC CGAAAGCTAT CGGGAGATGC GCGAAAACGG CTGGCTGGTA 
CAAACGGAAC GTGGCTTGCC GATCAATATG GATTTCCTCG GCAATACCAC TTACTTTGAT 
GCGACTCATC CGGGCGCGCG CGACTACGTC TGGGGCAAAG CCAAACGCAA CTATTACGAT 
AAAGGCGTGA AGTTATTCTG GTTAGATGAA GCCGAACCTG AGTTCAGCGT TTACGACTAC 
GACAACTATC GCTACCATGC CGGGCCGGTA CTGGAAGTGG GCAATATCTA CCCACGTATG 
TACGCTAAAA CCTTTTTTGA CGGCATGAAA GCCGATGGCG AAGACCAGGT TATCAACCTG 
CTACGCTGCG CCTGGGCCGG CAGTCAGAAG TTCGGCGCAC TGGTCTGGTC AGGTGATATT 
CACTCCTCGT TTAGATCGCT ACGCAACCAG TTTGCCGCCG GACTCAATAT GGGAATCGCG 
GGGATACCGT GGTGGACGAC GGATATCGGC GGTTTTCATG GCGGTAATAT TCACGACCCG 
AAATTCCATG AATTGCTGAT TCGCTGGTTC CAGTGGGGCG TCTTTAGTCC GGTGATGCGT 
CTGCACGGCA ACCGCGATCC GCAGATTTTA CCCGCGCAAC CGTACCGGGA TGGCATTGCT 
CAATGCCCTA CAGGTGCGCC GAACGAGGTC TGGAGCTACG GTGAGGAAGT ATGCGAGGTA 
CTGACAGGTT GCCTGGCGTT GCGAGAAAAA CTCAAGCCCT ATATCAAAGC GCTGATGGAG 
GAAACCCATA AGCACAATAC GCCAGTGATG CGCCCCCTGT TCTTTGAATT CCCCGAACAG 
GAAACAAGTT GGGCAATCAC CGACCAGTAT TGTTTTGGTC CTGACCTGCT GATCGCCCCC 
GTCATGCATG AAGGTATGCG CGAACGTGAT ATCTGGCTAC CGGAAGGGGA AACATGGACG 
GATCTTGCGA CCGGTGAAAG CTATTCAGGA GGGCAGACGC TGCATTACGC TACGCCACTG 
AACAGAATTC CGGTGTTTAT CCGCGAAGGT GGGCAGTACC GTAGCCTACT GAACTTGTAG

Protein sequence

MPFMQQDPRR LVWQQNDRYL WIEPWGENSL RVRSGRHLPV MRNEDWALTE PVAESQCHID 
YEHHQATLTN GKIIAIVNQK GQVTFYRHPH KPLLQEFWRL RGEIGEDESS HGQYVSALNL 
EGREFRPIQG GKYSLKARFE ATEGEKIYGM GQYQQANLDL KGCVLELAQR NSQASVPFML 
SSLGYGFLWN NPAVGRVTFA QNVTEWEAQV SEQLDYWITA GDTPAEISRA YALATGTPPM 
MPDYAMGFWQ CKLRYRTQEE LLEVAREYKR RNLPISVIVI DFFHWPNQGD WMFDARDWPD 
PDAMIAELKS LGIELMVSVW PTVDNRTESY REMRENGWLV QTERGLPINM DFLGNTTYFD 
ATHPGARDYV WGKAKRNYYD KGVKLFWLDE AEPEFSVYDY DNYRYHAGPV LEVGNIYPRM 
YAKTFFDGMK ADGEDQVINL LRCAWAGSQK FGALVWSGDI HSSFRSLRNQ FAAGLNMGIA 
GIPWWTTDIG GFHGGNIHDP KFHELLIRWF QWGVFSPVMR LHGNRDPQIL PAQPYRDGIA 
QCPTGAPNEV WSYGEEVCEV LTGCLALREK LKPYIKALME ETHKHNTPVM RPLFFEFPEQ 
ETSWAITDQY CFGPDLLIAP VMHEGMRERD IWLPEGETWT DLATGESYSG GQTLHYATPL 
NRIPVFIREG GQYRSLLNL