Gene SeD_A4219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4219
Symbol
ID	6873538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4063681
End bp	4064829
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	55%
IMG OID	642787152
Product	galactonate dehydratase
Protein accession	YP_002217778
Protein GI	198244787
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAA CTCACATCAC CACGTACCGT TTACCTCCAC GTTGGATGTT CCTGAAAATC 
GAAACGGATG AAGGCGTGGT TGGCTGGGGA GAGCCGGTCA TTGAAGGTCG GGCACGTACT 
GTAGAGGCGG CAGTACATGA GTTTGCCGAC TACCTGATAG GGAAAGATCC GGCGCGTATC 
AACGACCTAT GGCAGGTAAT GTACCGGGCC GGTTTTTATC GCGGCGGCCC GATTATGATG 
AGCGCCATCG CCGGTATTGA CCAGGCATTG TGGGATATCA AAGGCAAGGT GTTGAATGCG 
CCGGTCTGGC AGCTCATGGG CGGCCTGGTG CGCGACAAAA TCAAGGCCTA TAGCTGGGTG 
GGTGGCGATC GTCCGGCAGA CGTCATTGAC GGTATTGAAA AATTGCGCGG TATTGGTTTT 
GACACCTTCA AGCTGAACGG CTGTGAAGAG ATGGGCGTGA TTGATAACTC CCGTGCGGTG 
GATGCGGCGG TCAATACCGT GGCGCAAATC CGCGAAGCTT TCGGCAGTGA AATTGAGTTT 
GGGCTCGACT TCCACGGTCG CGTTAGCGCG CCGATGGCGA AGGTGCTGAT TAAAGAACTG 
GAACCCTATC GCCCGCTGTT TATTGAAGAG CCGGTGCTGG CGGAACAGGC GGAATATTAT 
CCGCGCCTGG CAGCGCAAAC GCATATTCCG ATTGCCGCAG GCGAACGTAT GTTCTCGCGT 
TTTGAATTTA AACGCGTGCT GGACGCGGGC GGGTTGGCGA TTCTACAGCC GGATTTATCC 
CACGCGGGCG GCATTACCGA ATGCTATAAA ATCGCCGGAA TGGCGGAAGC ATATGATGTG 
GCGCTGGCGC CGCATTGCCC GCTGGGTCCA ATCGCCCTGG CTGCCTGCCT GCATATCGAT 
TTTGTTTCGC GCAACGCGGT ATTCCAGGAG CAGAGCATGG GCATTCACTA TAACAAGGGC 
GCGGAGCTGC TCGACTTTGT GAAAAACAAA GAAGACTTCA GCATGGACGG CGGCTTCTTT 
AAACCCTTAA CCAAACCGGG TCTTGGCGTA GACATTGACG AGGCCAGGGT GATTGAACTT 
AGCAAAAGCG CGCCGGACTG GCGTAATCCG TTGTGGCGGC ACGCTGACGG ATCGGTAGCC 
GAGTGGTGA

Protein sequence

MKITHITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHEFAD YLIGKDPARI 
NDLWQVMYRA GFYRGGPIMM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVID GIEKLRGIGF DTFKLNGCEE MGVIDNSRAV DAAVNTVAQI REAFGSEIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PRLAAQTHIP IAAGERMFSR 
FEFKRVLDAG GLAILQPDLS HAGGITECYK IAGMAEAYDV ALAPHCPLGP IALAACLHID 
FVSRNAVFQE QSMGIHYNKG AELLDFVKNK EDFSMDGGFF KPLTKPGLGV DIDEARVIEL 
SKSAPDWRNP LWRHADGSVA EW