Gene SNSL254_A0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0838
Symbol	galK
ID	6486081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	842724
End bp	843872
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	57%
IMG OID	642736250
Product	galactokinase
Protein accession	YP_002040010
Protein GI	194446739
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGA AAGAGAAAAC GCGCGCGCTG TTTGCTGAAA TTTTCGGCTA CCCTGCTACC 
CACACGATTC AGGCGCCAGG CCGCGTCAAT CTGATCGGCG AGCACACTGA TTACAATGAT 
GGTTTTGTTC TGCCCTGCGC TATCGATTAC CAGACCGTAA TTAGCTGTGC GCCGCGCGAC 
GATCGTACCG TACGGGTGAT TGCCGCCGAT TACGACAATC AGGTGGACGA ATTTTCACTG 
GATGCGCCGA TCGTGACCCA CGATAGCCAG CAGTGGTCTA ACTATGTGCG CGGCGTAGTG 
AAACACCTGC AACAGCGTAA CAACGCGTTT GGCGGCGTGG ATATGGTCAT CAGCGGCAAT 
GTGCCGCAGG GCGCCGGGTT AAGCTCCTCC GCCTCGCTGG AAGTGGCGGT GGGCACAGTC 
TTCCAGCAGC TTTATCACCT GCCGCTGGAC GGCGCGCAAA TTGCGCTCAA CGGACAAGAG 
GCCGAGAACC AGTTTGTCGG CTGTAACTGC GGCATTATGG ATCAGCTCAT CTCTGCGCTC 
GGCAAAAAAG ATCATGCGTT GCTGATTGAT TGCCGTACGC TCGGCGCCAA AGCGGTTTCC 
ATGCCGAAAG GTGTCGCCGT GGTGATCATC AACAGTAACT TTAAGCGCAC GCTGGTAGGC 
AGCGAGTATA ATACCCGTCG TGAACAGTGC GAAACCGGCG CCCGTTTCTT CCAGCAGCCG 
GCCCTGCGCG ATGTCAGCCT TGAGGCGTTC AATGCCGTCG CCAGCGAACT GGACCCGGTA 
GTCGCAAAAC GCGTTCGCCA TGTATTGAGC GAAAATGCGC GCACCGTTGA AGCGGCAAGC 
GCGCTGGAGA AAGGTGATTT GCAACGTATG GGCCAACTGA TGGCGGAGTC CCATGCCTCA 
ATGCGCGATG ATTTCGAAAT TACCGTCCCG CAGATAGACA CGCTGGTAGA CATTGTCAAA 
GCGACCATCG GCGATCGAGG CGGCGTGCGC ATGACCGGCG GCGGCTTTGG CGGCTGTGTT 
GTCGCACTGA TCCCGGAAGA TCTGGTTCCC GCTGTTCGGC AGGCCGTTGC GCAACAGTAC 
GAAGCGAAAA CCGGAATCAA AGAAACCTTT TATGTATGCA AACCGTCACA AGGAGCAGGA 
CAGTGCTAA

Protein sequence

MNLKEKTRAL FAEIFGYPAT HTIQAPGRVN LIGEHTDYND GFVLPCAIDY QTVISCAPRD 
DRTVRVIAAD YDNQVDEFSL DAPIVTHDSQ QWSNYVRGVV KHLQQRNNAF GGVDMVISGN 
VPQGAGLSSS ASLEVAVGTV FQQLYHLPLD GAQIALNGQE AENQFVGCNC GIMDQLISAL 
GKKDHALLID CRTLGAKAVS MPKGVAVVII NSNFKRTLVG SEYNTRREQC ETGARFFQQP 
ALRDVSLEAF NAVASELDPV VAKRVRHVLS ENARTVEAAS ALEKGDLQRM GQLMAESHAS 
MRDDFEITVP QIDTLVDIVK ATIGDRGGVR MTGGGFGGCV VALIPEDLVP AVRQAVAQQY 
EAKTGIKETF YVCKPSQGAG QC