Gene VC0395_A1197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1197
Symbol	galK
ID	5137652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1260635
End bp	1261852
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	52%
IMG OID	640532655
Product	galactokinase
Protein accession	YP_001217143
Protein GI	147673567
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.765458
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGCGGCG CAGCACCAAC GCCAGCGTCG CTCTCCCCAT TTAAAGTGAG AAGCCCTATG 
TCTGAATTAA TCCAAAACGT GACTACAACC TTTGCACAAC TCTTTGGCTA TGATGCTACG 
CACCTTGTGC AAGCTCCGGG GCGGGTCAAT TTGATCGGCG AGCACACCGA CTACAACGAT 
GGCTTTGTGC TGCCTTGCGC GATTAACTAC CAAACCGTCG TGGCTGCAGC CAAACGGGAA 
GACTTTCTAG TGCGTTTGGT CGCCGTCGAT TACGACAATG ACACGGACGA ATTTGACCTG 
CGAGAAGAGA TTGCCTTTCA GCCTAAAAAA ATGTGGTCGA ACTATATTCG CGGTGTAATC 
AAGTGCTTGA TTGAACGTGG TTTTGAGTTT AATGGGGCAG ATATTGTGGT CTCAGGTAAC 
GTACCTCAAG GGGCGGGTCT CAGTTCCTCG GCGGCTTTAG AAGTCGTGAT TGGGCAAACT 
TTTAAAGAGC TTTACCAGCT AAAAATCAGT CAGGCGGAGA TCGCCCTCAA TGGCCAGCAA 
GCGGAGAACC AGTTTGTCGG TTGTAACTGC GGCATTATGG ATCAGATGAT CTCGGCGCAG 
GGGCAAGCGA ACCATGCCAT GTTGCTTGAT TGTCGTAGCT TGCAAACCGA GGCCGTTGCG 
ATGCCAGAGC AGATGGCAGT GGTGATCCTC AATTCCAATA AAAAACGCGG CTTGGTGGAG 
AGTGAATACA ATACCCGTCG TCAGCAATGC GAAGCCGCAG CCAAAACTTT TGGTGTGAAA 
GCGCTACGCG ATGTCACTTT GGCGCAATTG ACTGCAAAGC AGGCCGAACT TGATCCTGTG 
GTGGCCAAAC GTGCGCGCCA TGTCATCACG GAAAATGAAC GCACTTTACA TGCCGCTCAG 
GCCCTGCGTG AAGGAAACAT GCCGCGCTTA GGCGAGTTAA TGGCCGCTTC TCACGCTTCG 
ATGCGTGATG ATTTTGAAAT CACTGTCAAG GAGATAGATA CGCTGGTCGA GATTGTTCAA 
TCTGTGATTG GCGATCAAGG CGGTGTGCGG ATGACTGGCG GCGGCTTTGG TGGTTGTGTG 
GTGGCCCTTG TACACCCGAA GCAAGTAGAA GCGGTGCAGC AAGCGGTGGC TGAACACTAT 
GAAGCTGCGA CAGGGCTGAA GGCATCGATC TATGTCTGCC ATGCAACTTC GGGCGCGGGA 
TTGGTTGAGC TTGCATAA

Protein sequence

MSGAAPTPAS LSPFKVRSPM SELIQNVTTT FAQLFGYDAT HLVQAPGRVN LIGEHTDYND 
GFVLPCAINY QTVVAAAKRE DFLVRLVAVD YDNDTDEFDL REEIAFQPKK MWSNYIRGVI 
KCLIERGFEF NGADIVVSGN VPQGAGLSSS AALEVVIGQT FKELYQLKIS QAEIALNGQQ 
AENQFVGCNC GIMDQMISAQ GQANHAMLLD CRSLQTEAVA MPEQMAVVIL NSNKKRGLVE 
SEYNTRRQQC EAAAKTFGVK ALRDVTLAQL TAKQAELDPV VAKRARHVIT ENERTLHAAQ 
ALREGNMPRL GELMAASHAS MRDDFEITVK EIDTLVEIVQ SVIGDQGGVR MTGGGFGGCV 
VALVHPKQVE AVQQAVAEHY EAATGLKASI YVCHATSGAG LVELA