Gene SeHA_C4161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4161
Symbol
ID	6488475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4044842
End bp	4045990
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	56%
IMG OID	642744256
Product	galactonate dehydratase
Protein accession	YP_002047860
Protein GI	194448998
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAA CTCACATCAC CACGTACCGT TTACCTCCAC GTTGGATGTT CCTGAAAATC 
GAAACGGATG AAGGCGTGGT TGGCTGGGGA GAGCCGGTCA TTGAAGGTCG GGCACGTACT 
GTAGAGGCGG CAGTACATGA GTTTGCCGAC TACCTGATAG GGAAAGATCC GGCGCGTATC 
AACGACCTGT GGCAGGTAAT GTACCGGGCC GGTTTTTATC GCGGCGGCCC GATTATGATG 
AGCGCCATCG CCGGTATTGA CCAGGCATTG TGGGATATCA AAGGCAAGGT GTTGAATGCG 
CCGGTCTGGC AGCTCATGGG CGGCCTGGTG CGCGACAAAA TCAAGGCCTA TAGCTGGGTG 
GGCGGCGATC GTCCGGCAGA CGTCATTGAC GGTATTGAAA AATTGCGCGG TATTGGTTTT 
GACACCTTCA AGCTGAACGG CTGTGAAGAG ATGGGCGTGA TTGATAACTC CCGTGCGGTG 
GATGCGGCGG TCAATACCGT GGCGCAAATC CGCGAAGCTT TCGGCAGTGA AATTGAGTTT 
GGGCTCGATT TCCACGGTCG CGTTAGCGCG CCGATGGCGA AGGTGCTGAT TAAAGAACTG 
GAACCCTATC GCCCGCTGTT TATTGAAGAG CCGGTGCTGG CGGAACAGGC GGAATATTAT 
CCGCGCCTGG CAGCGCAAAC GCATATTCCG ATTGCCGCAG GCGAACGTAT GTTCTCGCGT 
TTTGAATTTA AACGCGTGCT GGACGCGGGC GGGTTGGCGA TTCTACAGCC GGATTTATCC 
CACGCGGGCG GCATTACCGA ATGCTATAAA ATCGCCGGAA TGGCGGAAGC ATATGATGTG 
GCGCTGGCGC CGCATTGCCC GCTGGGTCCA ATCGCCCTGG CTGCCTGCCT GCATATCGAT 
TTTGTTTCGC GCAACGCGGT ATTCCAGGAG CAGAGCATGG GCATTCACTA TAACAAGGGC 
GCGGAGCTGC TCGACTTTGT GAAAAACAAA GAAGACTTCA GCATGGACGG CGGCTTCTTT 
AAACCCTTAA CCAAACCGGG TCTTGGCGTA GACATTGACG AGGCCAGGGT GATTGAACTT 
AGCAAAAGCG CGCCGGACTG GCGTAATCCG TTGTGGCGGC ACGCTGACGG ATCGGTAGCC 
GAGTGGTGA

Protein sequence

MKITHITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHEFAD YLIGKDPARI 
NDLWQVMYRA GFYRGGPIMM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVID GIEKLRGIGF DTFKLNGCEE MGVIDNSRAV DAAVNTVAQI REAFGSEIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PRLAAQTHIP IAAGERMFSR 
FEFKRVLDAG GLAILQPDLS HAGGITECYK IAGMAEAYDV ALAPHCPLGP IALAACLHID 
FVSRNAVFQE QSMGIHYNKG AELLDFVKNK EDFSMDGGFF KPLTKPGLGV DIDEARVIEL 
SKSAPDWRNP LWRHADGSVA EW