Gene SeHA_C0423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0423
Symbol
ID	6492348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	421964
End bp	422842
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	50%
IMG OID	642740695
Product	5-oxopent-3-ene-1,2,5-tricarboxylate decarboxylase
Protein accession	YP_002044362
Protein GI	194450752
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.000322521
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACTGG TTCAATATCT TGTGAACGGT GGCAAACGCT ACGGCATTAT GCAGGAAATC 
GGAATAATTG ATCTCTCGCA GCGGCTTGGC GACAAATATC CCACTTTGAA ATCTCTCCTG 
TGCGCTAATG CGCTGACGGA TGCGGCGTTA TGGTGTGATG AGCCGGCGGA TTATTACTAC 
CAGGAAGTCA CTTTTCTGCC GGTGATTGAC GATCCGCAGA AGATCATCTG TGTCGGAATG 
AATTATGCCG ATAAGCGTAT TGAGTTTAAT GAAACCAACC CGGCCCCAAC CCTTTTTGTC 
CGCTTTGCGG ATTCTCAGAC CGGGCATAAT GGCCTGCTGC TGAAGCCTGA AAATACCAAT 
GAGTTCGACT ACGAAGGTGA ATTAGCCGTA GTGATTGGGC GGCGATGCTC CCGGGTCAGC 
GCTGAGGATG CTTTAGATTA TGTCGCCGGA TACAGCTGCT ATATGGATGG TTCAGTGAGG 
GACTGGCAGC ATAGCTGGTT TACGGCTGGA AAAAACTGGC CTTCGACAGG ATCATTCGGT 
CCGTGTCTGG TGACCACAGA CGACATTCCC GATCCCCAGA TGCTACGTTT ACTGACACGA 
CTAAACGGGC GGGAGGTGCA GAACGAATCT ACGGCAAATA TGATCCATCC TATCGCTTCA 
CTCATTGCTT ATATAAGCAC CTTTACTCTG CTTTCCCCTG GCGACACGAT CCTCACAGGG 
TCGCCTGGTG GAGTGGGCAA AAAACGCGTT CCACCGCTGT TTTTACACGA TGGTGATGTT 
ATTGAAGTTG AGATTGAACA TATTGGAACC CTGCGCAATG TCGTCCGGGA TAGCCGTTAT 
TTAACATCAT CTGTTAGCTG GCATGACGGG AGAAAGTGA

Protein sequence

MKLVQYLVNG GKRYGIMQEI GIIDLSQRLG DKYPTLKSLL CANALTDAAL WCDEPADYYY 
QEVTFLPVID DPQKIICVGM NYADKRIEFN ETNPAPTLFV RFADSQTGHN GLLLKPENTN 
EFDYEGELAV VIGRRCSRVS AEDALDYVAG YSCYMDGSVR DWQHSWFTAG KNWPSTGSFG 
PCLVTTDDIP DPQMLRLLTR LNGREVQNES TANMIHPIAS LIAYISTFTL LSPGDTILTG 
SPGGVGKKRV PPLFLHDGDV IEVEIEHIGT LRNVVRDSRY LTSSVSWHDG RK