Gene EcE24377A_0784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0784
Symbol	galK
ID	5586335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	808296
End bp	809444
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	640924496
Product	galactokinase
Protein accession	YP_001461911
Protein GI	157158993
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA AAGAAAAAAC ACAATCTCTG TTTGCCAACG CATTTGGCTA CCCTGCCACT 
CACACCATTC AGGCGCCTGG CCGCGTGAAT TTGATTGGTG AACACACCGA CTACAACGAC 
GGTTTCGTTC TGCCCTGCGC GATTGATTAT CAAACCGTGA TCAGCTGTGC GCCACGCGAT 
GACCGTAAAG TTCGCGTAAT GGCAGCCGAT TATGAAAATC AGCTCGACGA GTTTTCCCTC 
GATGCGCCCA TTGTCGCGCA TGAAAACTAT CAATGGGCGA ACTACGTTCG TGGCGTGGTG 
AAACATCTGC AACTGCGTAA CAACAGCTTC GGCGGCGTGG ACATGGTGAT CAGCGGCAAT 
GTGCCGCAGG GTGCCGGGTT AAGTTCTTCC GCTTCACTGG AAGTCGCGGT CGGAACCGTA 
TTGCAGCAGC TTTATCATCT GCCGCTGGAC GGCGCACAAA TCGCGCTTAA CGGTCAGGAA 
GCAGAAAACC AGTTTGTTGG CTGTAACTGC GGGATCATGG ATCAGCTAAT TTCCGCACTC 
GGCAAGAAAG ATCATGCCTT GCTGATTGAC TGCCGCTCAC TGGGGACTAA AGCAGTTTCC 
ATGCCGAAAG GTGTGGCTGT CGTCATCATC AACAGTAACT TCAAACGTAC CCTGGTTGGC 
AGCGAATACA ACACCCGTCG TGAACAGTGC GAAACCGGTG CGCGTTTCTT CCAGCAGCCA 
GCCCTGCGCG ATGTCACCAT TGAAGAGTTC AACGCTGTTG CACATGAGCT GGACCCAATC 
GTGGCGAAAC GCGTGCGGCA TATCCTGACT GAAAACGCCC GCACCGTTGA AGCTGCCAGC 
GCGCTGGAGC AGGGCGACCT GAAACGTATG GGCGAGTTGA TGGCGGAGTC TCATGCCTCT 
ATGCGCGATG ATTTCGAAAT CACCGTGCCG CAAATTGACA CTCTGGTAGA AATCGTCAAA 
GCTGTGATTG GCGACAAAGG TGGCGTACGC ATGACCGGCG GCGGATTTGG CGGCTGTATC 
GTCGCGTTGA TCCCGGAAGA GCTGGTGCCT GCCGTACAGC AAGCTGTCGC TGAACAATAT 
GAAGCAAAAA CAGGTATTAA AGAGACTTTT TACGTTTGTA AACCATCACA AGGAGCAGGA 
CAGTGCTGA

Protein sequence

MSLKEKTQSL FANAFGYPAT HTIQAPGRVN LIGEHTDYND GFVLPCAIDY QTVISCAPRD 
DRKVRVMAAD YENQLDEFSL DAPIVAHENY QWANYVRGVV KHLQLRNNSF GGVDMVISGN 
VPQGAGLSSS ASLEVAVGTV LQQLYHLPLD GAQIALNGQE AENQFVGCNC GIMDQLISAL 
GKKDHALLID CRSLGTKAVS MPKGVAVVII NSNFKRTLVG SEYNTRREQC ETGARFFQQP 
ALRDVTIEEF NAVAHELDPI VAKRVRHILT ENARTVEAAS ALEQGDLKRM GELMAESHAS 
MRDDFEITVP QIDTLVEIVK AVIGDKGGVR MTGGGFGGCI VALIPEELVP AVQQAVAEQY 
EAKTGIKETF YVCKPSQGAG QC