Gene SNSL254_A4112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4112
Symbol
ID	6486387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4001218
End bp	4002366
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	56%
IMG OID	642739368
Product	galactonate dehydratase
Protein accession	YP_002043077
Protein GI	194443079
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.205397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAA CTCACATCAC CACGTACCGT TTACCTCCAC GTTGGATGTT CCTGAAAATC 
GAAACGGATG AAGGCGTGGT TGGCTGGGGA GAGCCGGTCA TTGAAGGTCG GGCACGTACT 
GTAGAGGCGG CAGTACATGA GTTTGCCGAC TACCTGATAG GGAAAGATCC GGCGCGTATC 
AACGACCTGT GGCAGGTAAT GTACCGGGCC GGTTTTTATC GCGGCGGCCC GATTATGATG 
AGCGCCATCG CCGGTATTGA CCAGGCATTG TGGGATATCA AAGGCAAGGT GTTGAATGCG 
CCGGTCTGGC AGCTCATGGG CGGCCTGGTG CGCGACAAAA TCAAGGCCTA TAGCTGGGTG 
GGTGGCGATC GTCCGGCAGA CGTCATTGAC GGTATTGAAA AATTGCGCGG TATTGGTTTT 
GACACCTTCA AGCTGAACGG CTGTGAAGAG ATGGGCGTGA TTGATAACTC CCGTGCGGTG 
GATGCGGCGG TCAATACCGT GGCGCAAATC CGCGAAGCTT TTGGCAGTGA AATTGAGTTT 
GGGCTCGATT TCCACGGTCG CGTTAGCGCG CCGATGGCGA AGGTGCTGAT TAAAGAACTG 
GAACCCTATC GTCCGCTGTT TATTGAAGAG CCGGTGCTGG CGGAACAGGC GGAATATTAT 
CCGCGCCTGG CGGCGCAAAC GCATATTCCG ATTGCTGCAG GCGAGCGTAT GTTCTCGCGT 
TTTGAGTTTA AACGCGTGCT GGACGCGGGT GGGCTGGCGA TTCTACAGCC GGATTTATCC 
CACGCGGGCG GCATTACCGA ATGCTATAAA ATCGCCGGAA TGGCGGAAGC ATATGATGTG 
GCGCTGGCGC CGCATTGCCC GCTGGGTCCA ATCGCCCTGG CTGCCTGCCT GCATATCGAT 
TTTGTTTCGC GCAACGCGGT ATTCCAGGAG CAGAGCATGG GCATTCACTA TAACAAGGGC 
GCGGAGCTGC TCGACTTTGT GAAAAACAAA GAAGACTTCA GCATGGACGG CGGCTTCTTT 
AAACCCTTGA CCAAACCGGG TCTTGGCGTA GACATTGACG AGGCCAGGGT GATTGAACTT 
AGCAAAAGCG CGCCGGACTG GCGTAATCCG TTGTGGCGGC ACGCTGACGG ATCGGTAGCC 
GAGTGGTGA

Protein sequence

MKITHITTYR LPPRWMFLKI ETDEGVVGWG EPVIEGRART VEAAVHEFAD YLIGKDPARI 
NDLWQVMYRA GFYRGGPIMM SAIAGIDQAL WDIKGKVLNA PVWQLMGGLV RDKIKAYSWV 
GGDRPADVID GIEKLRGIGF DTFKLNGCEE MGVIDNSRAV DAAVNTVAQI REAFGSEIEF 
GLDFHGRVSA PMAKVLIKEL EPYRPLFIEE PVLAEQAEYY PRLAAQTHIP IAAGERMFSR 
FEFKRVLDAG GLAILQPDLS HAGGITECYK IAGMAEAYDV ALAPHCPLGP IALAACLHID 
FVSRNAVFQE QSMGIHYNKG AELLDFVKNK EDFSMDGGFF KPLTKPGLGV DIDEARVIEL 
SKSAPDWRNP LWRHADGSVA EW