Gene SeHA_C0901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0901
Symbol	galK
ID	6489304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	886641
End bp	887789
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	57%
IMG OID	642741149
Product	galactokinase
Protein accession	YP_002044802
Protein GI	194451386
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGA AAGAGAAAAC GCGCGCGCTG TTTGCTGAAA TTTTCGGCTA CCCTGCCACC 
CACACGATTC AGGCGCCAGG CCGCGTCAAT CTGATCGGCG AGCACACTGA TTACAATGAT 
GGTTTTGTTC TGCCCTGCGC TATCGATTAC CAGACCGTAA TTAGCTGTGC GCCGCGCGAC 
GATCGTACCG TACGGGTGAT TGCCGCCGAT TACGACAATC AGGTGGACGA ATTTTCACTG 
GATGCGCCGA TCGTGACCCA CGATAGCCAG CAGTGGTCTA ACTATGTGCG CGGCGTAGTG 
AAACACCTGC AACAGCGTAA CAACGCGTTT GGCGGCGTGG ATATGGTCAT CAGCGGCAAT 
GTGCCGCAGG GCGCCGGGTT AAGCTCCTCC GCCTCGCTGG AAGTGGCGGT GGGCACCGTC 
TTCCAGCAGC TTTATCACCT GCCGCTGGAC GGCGCGCAAA TTGCGCTCAA CGGACAAGAG 
GCCGAGAACC AGTTTGTCGG CTGTAACTGC GGCATTATGG ATCAGCTCAT CTCTGCGCTC 
GGCAAAAAAG ATCATGCGTT GCTGATTGAT TGCCGTACGC TCGGCGCCAA AGCGGTTTCC 
ATGCCGAAAG GTGTCGCCGT GGTGATCATC AACAGTAACT TTAAGCGCAC GCTGGTGGGC 
AGCGAGTATA ATACCCGCCG TGAACAGTGC GAAACCGGCG CCCGTTTCTT CCAGCAGCCG 
GCCCTGCGCG ATGTCAGCCT TGAGGCGTTC AATGCCGTTG CCAGCGAACT GGACCCGGTA 
GTCGCAAAAC GCGTTCGCCA TGTATTGAGC GAAAATGCGC GCACCGTTGA AGCGGCAAGC 
GCGCTGGAGA AAGGTGATTT GCAACGTATG GGCCAACTGA TGGCGGAGTC CCATGCCTCA 
ATGCGCGATG ATTTCGAAAT TACCGTCCCG CAGATAGACA CGCTGGTAGA CATCGTCAAA 
GCGACCATCG GCGATCAAGG CGGCGTGCGC ATGACCGGCG GCGGCTTCGG CGGCTGTGTT 
GTCGCACTGA TCCCGGAAGA TCTGGTTCCC GCTGTTCGGC AGGCCGTTGC GCAACAGTAC 
GAAGCGAAAA CCGGAATCAA AGAAACCTTT TATGTATGCA AACCGTCACA AGGAGCAGGA 
CAGTGCTAA

Protein sequence

MNLKEKTRAL FAEIFGYPAT HTIQAPGRVN LIGEHTDYND GFVLPCAIDY QTVISCAPRD 
DRTVRVIAAD YDNQVDEFSL DAPIVTHDSQ QWSNYVRGVV KHLQQRNNAF GGVDMVISGN 
VPQGAGLSSS ASLEVAVGTV FQQLYHLPLD GAQIALNGQE AENQFVGCNC GIMDQLISAL 
GKKDHALLID CRTLGAKAVS MPKGVAVVII NSNFKRTLVG SEYNTRREQC ETGARFFQQP 
ALRDVSLEAF NAVASELDPV VAKRVRHVLS ENARTVEAAS ALEKGDLQRM GQLMAESHAS 
MRDDFEITVP QIDTLVDIVK ATIGDQGGVR MTGGGFGGCV VALIPEDLVP AVRQAVAQQY 
EAKTGIKETF YVCKPSQGAG QC