Gene SbBS512_E0678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0678
Symbol	galK
ID	6269571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	643116
End bp	644264
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	641724874
Product	galactokinase
Protein accession	YP_001879407
Protein GI	187732980
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA AAGAAAAAAC ACAATCTCTG TTTGCCAACG CATTTGGCTA CCCTGCCACT 
CACACCATTC AGGCGCCTGG CCGCGTGAAT TTGATTGGTG AACACACGGA CTACAACGAC 
GGTTTCGTTC TGCCCTGCGC GATTGATTAT CAAACCGTGA TCAGCTGTGC ACCACGCGAT 
GACCGTAAAG TTCGCGTGAT GGCAGCCGAT TATGAAAATC AGCTCGACGA GTTTTCCCTC 
AATGCGCCCA TTGTCGCGCA TGAAAACTAT CAATGGGCGA ACTACGTTCG TGGCGTGGTG 
AAACATCTGC AACTGCGTAA CAACAGCTTC GGCGGTGTGG ACATGGTGAT CAGCGGCAAT 
GTGCCGCAGG GTGCCGGGTT AAGTTCTTCC GCTTCACTGG AAGTCGCGGT CGGAACCGTA 
TTGCAGCAGC TTTATCATCT GCCGCTGGAC GGCGCACAAA TCGCGCTTAA CGGTCAGGAA 
GCAGAAAACC AGTTTGTTGG CTGTAACTGC GGGATCATGG ATCAGCTAAT TTCCGCACTC 
GGCAAGAAAG ATCATTCCTT GCTGATTGAC TGTCGTTCAC TGGGGACCAA AGCAGTTTCC 
ATGCCGAAAG GTGTGGCTGT CGTCATCATC AACAGTAACT TCAAACGTAC CCTGGTTGGC 
AGCGAATACA ACACCCGTCG TGAACAGTGC GAAACCGGTG CGCGTTTCTT CCAGCAGCCA 
GCCCTGCGCG ATGTCACCAT TGAAGAGTTC AATGCTGTTG CACATGAGCT GGACCCAATC 
GTGGCGAAAC GCGTGCGGCA TATCCTGACT GAAAACGCCC GCACCGTTGA AGCTGCCAGC 
GCGCTGGAGC AGGGCGACCT GAAACGTATG GGCGAGTTGA TGGCGGAGTC TCATGCCTCT 
ATGCGCGATG ATTTCGAAAT CACCGTGCCG CAAATTGACA CTCTGGTAGA AATCGTCAAA 
GCTGTGATTG GCGACAAAGG TGGCGTACGC ATGACCGGCG GCGGATTTGG CGGCTGTATC 
GTCGCGTTGA TCCCGGAAGA GCTGGTGCCT GCCGTACAGC AAGCTGTCGC TGAACAATAT 
GAAGCAAAAA TAGGTATTAA AGAGACTTTT TACGTTTGTA AACCATCACA AGGAGCAGGA 
CAGTGCTGA

Protein sequence

MSLKEKTQSL FANAFGYPAT HTIQAPGRVN LIGEHTDYND GFVLPCAIDY QTVISCAPRD 
DRKVRVMAAD YENQLDEFSL NAPIVAHENY QWANYVRGVV KHLQLRNNSF GGVDMVISGN 
VPQGAGLSSS ASLEVAVGTV LQQLYHLPLD GAQIALNGQE AENQFVGCNC GIMDQLISAL 
GKKDHSLLID CRSLGTKAVS MPKGVAVVII NSNFKRTLVG SEYNTRREQC ETGARFFQQP 
ALRDVTIEEF NAVAHELDPI VAKRVRHILT ENARTVEAAS ALEQGDLKRM GELMAESHAS 
MRDDFEITVP QIDTLVEIVK AVIGDKGGVR MTGGGFGGCI VALIPEELVP AVQQAVAEQY 
EAKIGIKETF YVCKPSQGAG QC