Gene Ccel_3238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3238
Symbol
ID	7311817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3777685
End bp	3778878
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	39%
IMG OID	643610140
Product	galactokinase
Protein accession	YP_002507508
Protein GI	220930599
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.217049
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAAAA ATTATGATGA GCTAAAGAAA AAGTTTTGCC GTATATACGG TGGTAGTGAA 
GAGGATTTAA GGATATTTTC AGGGCCCGGA AGAGTAAATC TCATCGGAGA ACACATTGAC 
TATTGCGGCG GGTTTGTTTT TCCGGCTGCT TTAAGCCTTG ATTCCACTGT GATTGCAAGA 
ATAAATAATG ATAATACCCT AAGAGTTGCA GCAACAGATC TGCCTGATAG GGTAGAGGTG 
GAACTGGACA AACTGGAAAG TGCAAAGAGT CTGAAATGGG GAAACTATCA GGCAGGAGTA 
GCATTTATGC TCCAAGATGC AGGCTATAGG TTGGTGGGGG TAGACATGCT TTTTCACGAC 
ACTGTTCCAC TGGGATCAGG ACTTTCATCT TCTGCGGCAA TAGAGTTGGC AACGGCAGTT 
ACATTAGTTA CTCTGTCTAA TGAGGTATAT GGAATAACAA AACCAATAGA TATGGTAGAA 
ATGGCTGTAC TGGGACAAAG AACCGAAAAT GAATTCTGCG GAGTAAGCTG TGGAATAATG 
GATCAGTTCG CATCTGCAAT GGGTAAAAAG GACCATGCTA TTTTGTTAGA TTGCGGAACT 
TTGGAATATA AATATTTACC ATTAAAGCTT GATGGTTATA AAATAGTACT TGGAAATACA 
AAGAAAAAAC GTGCACTTGG CGAATCAAAA TATAATGAGA GAGTCAGAGA ATGTGCAGAA 
GGCTTAAAAA TACTGCAAAA ATATTTGCCG AACAAAAGGA ATTTATGTGA TATAACTGTT 
TCCGAATTTG AGCAATACAA GTCAATGATT GAGGATGAAG TAATCAAAAA AAGAGTTACT 
CATGTTATCA GCGAAAACGA CAGAGTACTT AGAGCCGCAG AGGCACTAAA GAGAAATGAC 
TTAGAAGAGC TGGGAAGGCT TTTGGTAGAG GCAAATGATT CAATCAGGGA TTTATATGAA 
GTTACCGGAA AGGAACTTGA CACAATGACT GCCGAAGCTA TGAAGGTTGA GGGAGTTTTA 
GGTGCAAGAA TGACTGGTGC CGGATTTGGA GGATGTACAG TAAACATAGT TCCGGAGGAT 
AAGGTTGATT TGTTTATTCA GCAAGTTGGC GAGAATTACA AAGAACAAAC TGGTATAACT 
CCAGAGTTTT ATGTCAGTGA AATAAGTGAC GGAGCAAGAG AAATCAAGAT TTAA

Protein sequence

MQKNYDELKK KFCRIYGGSE EDLRIFSGPG RVNLIGEHID YCGGFVFPAA LSLDSTVIAR 
INNDNTLRVA ATDLPDRVEV ELDKLESAKS LKWGNYQAGV AFMLQDAGYR LVGVDMLFHD 
TVPLGSGLSS SAAIELATAV TLVTLSNEVY GITKPIDMVE MAVLGQRTEN EFCGVSCGIM 
DQFASAMGKK DHAILLDCGT LEYKYLPLKL DGYKIVLGNT KKKRALGESK YNERVRECAE 
GLKILQKYLP NKRNLCDITV SEFEQYKSMI EDEVIKKRVT HVISENDRVL RAAEALKRND 
LEELGRLLVE ANDSIRDLYE VTGKELDTMT AEAMKVEGVL GARMTGAGFG GCTVNIVPED 
KVDLFIQQVG ENYKEQTGIT PEFYVSEISD GAREIKI