Gene SeHA_C4022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4022
Symbol
ID	6488575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3904466
End bp	3905662
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	54%
IMG OID	642744123
Product	mandelate racemase/muconate lactonizing enzyme
Protein accession	YP_002047728
Protein GI	194449480
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTAA GCGCGAATTC CGACGCCGTA ACGTATGCAA AAGCGGCGAA TACCAGAACC 
GCGGCAGAAA CCGGCGATCG TATCGAATGG GTGAAGCTAT CACTGGCTTT TCTACCGCTG 
GCGACGCCAG TGAGTGACGC GAAGGTACTG ACCGGTCGCC AGAAACCTTT GACCGAAGTG 
GCAATCATCA TTGCCGAAAT CCGCAGTCGC GATGGCTTTG AAGGCGTTGG TTTTAGCTAC 
TCCAAACGTG CTGGCGGCCA GGGTATTTAT GCTCACGCCA AAGAGATAGC CGATAATCTA 
CTGGGCGAAG ATCCCAATGA TATCGACAAA ATATACACTA AGCTGCTGTG GGCCGGAGCC 
TCAGTGGGGC GTAGCGGGAT GGCGGTACAG GCTATCTCCC CTATCGATAT CGCCTTATGG 
GATATGAAGG CTAAACGTGC CGGTCTGCCA CTGGCAAAAC TGTTGGGCGC GCACCGCGAC 
TCCGTTCAGT GTTACAACAC CTCGGGGGGG TTCTTGCATA CACCGCTCGA TCAAGTGCTG 
AAAAATGTGG TGATTTCCCG CGAAAATGGC ATTGGCGGTA TTAAGTTGAA AGTCGGACAA 
CCCAACTGCG CTGAGGATAT TCGCCGCTTA ACCGCAGTAC GTGAAGCGCT TGGGGATGAG 
TTCCCGTTAA TGGTTGACGC TAACCAGCAG TGGGATCGCG AAACGGCTAT CCGCATGGGG 
CGTAAAATGG AACAGTTCAA TCTTATCTGG ATTGAAGAAC CACTAGATGC TTACGACATC 
GAAGGCCACG CCCAGCTTGC TGCCGCGCTG GATACGCCTA TCGCCACCGG GGAAATGCTG 
ACCAGTTTCC GGGAACACGA GCAGTTGATT CTGGGCAATG CCAGCGATTT CGTTCAGCCA 
GATGCGCCGC GTGTCGGCGG TATCTCTCCT TTCCTGAAGA TTATGGATCT GGCGGCGAAA 
CACGGGCGTA AGCTGGCGCC GCACTTTGCG ATGGAAGTAC ACCTGCACCT TTCCGCAGCG 
TATCCCCTGG AGCCGTGGCT GGAACATTTC GAGTGGCTGA ACCCATTATT CAACGAGCAA 
CTTGAGCTGC GCGATGGCCG CATGTGGATT TCCGATCGTC ATGGTCTGGG TTTCACGCTC 
AGTGAACAAG CGCGCCGCTG GACACAATTA ACATGTGAAT TTGGCAAACG CCCTTAA

Protein sequence

MALSANSDAV TYAKAANTRT AAETGDRIEW VKLSLAFLPL ATPVSDAKVL TGRQKPLTEV 
AIIIAEIRSR DGFEGVGFSY SKRAGGQGIY AHAKEIADNL LGEDPNDIDK IYTKLLWAGA 
SVGRSGMAVQ AISPIDIALW DMKAKRAGLP LAKLLGAHRD SVQCYNTSGG FLHTPLDQVL 
KNVVISRENG IGGIKLKVGQ PNCAEDIRRL TAVREALGDE FPLMVDANQQ WDRETAIRMG 
RKMEQFNLIW IEEPLDAYDI EGHAQLAAAL DTPIATGEML TSFREHEQLI LGNASDFVQP 
DAPRVGGISP FLKIMDLAAK HGRKLAPHFA MEVHLHLSAA YPLEPWLEHF EWLNPLFNEQ 
LELRDGRMWI SDRHGLGFTL SEQARRWTQL TCEFGKRP