Gene SeHA_C2661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2661
Symbol	glk
ID	6489873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2575767
End bp	2576732
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	53%
IMG OID	642742839
Product	glucokinase
Protein accession	YP_002046472
Protein GI	194447469
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	0.077785
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAGT ATGCTTTAGT AGGAGATGTA GGCGGCACGA ATGCGCGTCT TGCCCTGTGT 
GATATCGCCA GTGGAGAAAT CTCGCAGGCC AAAACGTATT CCGGCCTGGA TTATCCCAGT 
CTTGAGGCCG TGGTGCGCGT TTATCTCGAT GAGCATAGCG TCAGCGTGGA AGATGGTTGT 
ATCGCCATAG CCTGTCCGAT TACCGGTGAC TGGGTAGCGA TGACTAACCA TACCTGGGCT 
TTTTCTATTG CGGAAATGAA AAAAAATCTC GGCTTTAGCC ATCTGGAAAT CATCAACGAT 
TTCACCGCCG TGTCGATGGC GATCCCGATG CTGAAAAAAG AGCATTTAAT TCAGTTCGGC 
GGCGGCGAAC CGGTAGACGG CAAACCTATT GCGGTGTATG GCGCGGGAAC CGGCTTGGGC 
GTGGCGCATC TGGTGCATGT GGATAAGCGT TGGATTAGCC TTCCGGGCGA AGGCGGGCAT 
GTCGATTTTG CGCCTAATAG CGAAGAAGAA GCTATGATTC TGGAAATATT GCGCGCCGAA 
ATTGGCCACG TTTCCGCCGA GCGCGTGCTG TCTGGCCCGG GGCTGGTGAA TCTTTACCGG 
GCGATTGTTA AGTCCGACAA CCGTCTGCCG GAGAATCTGC GCCCGAAAGA TATTACCGAA 
CGCGCCCTGG CGGATAACTG TATCGATTGT CGCCGCGCGT TGTCGCTCTT TTGCGTCATC 
ATGGGGCGAT TTGGCGGCGA TCTGGCGTTA ACCATGGGGA CATATGGCGG CGTTTATATC 
GCTGGCGGTA TTGTCCCGCG CTTCCTGGAA TTTTTTAAAG CGTCTGGCTT CCGTGGTGGC 
TTTGAAGATA AAGGCCGCTT TAAAGATTAT GTACACGGTA TTCCGGTCTA TCTGATTGTC 
CATGATAACC CTGGCTTGTT AGGCTCCGGC GCGCATCTGC GCCAGACATT AGGTCATATT 
CTATAA

Protein sequence

MTKYALVGDV GGTNARLALC DIASGEISQA KTYSGLDYPS LEAVVRVYLD EHSVSVEDGC 
IAIACPITGD WVAMTNHTWA FSIAEMKKNL GFSHLEIIND FTAVSMAIPM LKKEHLIQFG 
GGEPVDGKPI AVYGAGTGLG VAHLVHVDKR WISLPGEGGH VDFAPNSEEE AMILEILRAE 
IGHVSAERVL SGPGLVNLYR AIVKSDNRLP ENLRPKDITE RALADNCIDC RRALSLFCVI 
MGRFGGDLAL TMGTYGGVYI AGGIVPRFLE FFKASGFRGG FEDKGRFKDY VHGIPVYLIV 
HDNPGLLGSG AHLRQTLGHI L