Gene Ccel_3221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3221
Symbol
ID	7311802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3757000
End bp	3758295
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	38%
IMG OID	643610123
Product	hexokinase
Protein accession	YP_002507491
Protein GI	220930582
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5026] Hexokinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGTCCA AATTAGAAAT AGTACAGGAT GTTATTAATG CTTTTGAGGT TAATAAAGAA 
AGTATGCTGC GTACTGCAAT GCTGTTTAAG GAAACTATGG AAAAAAGTCT GAATGGCGAA 
AAAACCTGCC TTAAAATGCT TCCATCATAT ATTGGAAAGC CTACGGGAAA AGAACAGGGT 
ACTTTTATGA CCATCGACAT GGGTGGCACT AATTTCAGAT GCACAAAGTA TAAAATTAAC 
AATGGCAACT TTGAGAAAGT TGGTGAAATA AAACAGAAGC TAATTAATAA GGAAAAGAAT 
TATGACCTTA CAAAGTCAGA TTCAGATGAA AAGCAGCTGT TTGGATTTAT GGCTGAATGC 
ATAGGAGAGT TGCTAGAGCC GGAAGAATCT TTATATCTTG GAAACACGTT TTCATTCCCA 
TGCAGACAGG AAGGAATCAA TGATGCTTAT CTTATTCAGT GGACCAAGGA AATAACAACT 
TCAGGCGTTG TAGGCCAGAA TATTAATAAG CTTCTTGAAC AGTCATTAAA GGAGAAAAAT 
ATAAATGTTA AGCCCGTCGC CATACTGAAT GATACCGTAG GTACTTTACT GGTAGCAATG 
TACAGTTATC AGACGGCGGA TATAGGATCT ATAATGGGTA CAGGGCATAA CACATGTTAT 
CTGGAGAACA ATCATCCTCT TAATGGTCAA AAGATGATTG TAAACATAGA ATCGGGCAAC 
TATAATGTGG GACTTCCCGT AACCAAGTAC GATGAGATAA TAGATAAAAA CAGTCAAATA 
CCGGGAGCAC AGCTCCTTGA AAAAATGGTT TCCGGTTACT ACATGGGGAG CCTTCTGAAA 
GAGGTTTGTA AGGATCTCTA CAAAAATAAT GCATTGTTTA CAAATGAGGA TGTTGATATA 
GATGCGTTTT TCAATCAGAA CTTCAACGCA TTGATGGTAG AGAATTTCAT TTTGTATCCT 
TCCAATACAA AAGAGCAATA TAAATGTTCC ATTGAAGATG CGGAGATAGT AAAGAGGGTA 
TCCGAAGCCA TATTGAAAAG AACAGTGAGA CTGGTAGCGG TATCACACAT GGGAATACTT 
TTTCACCAGG AAAACAGCGG TACTTCTGTC AATAATGAGC ATGTAATTGC AATAGACGGA 
ACAATATATG AAAAAATGCC CAATGCTCCC CAGCTTATGA AGGAGGCATT CAGGGAGGCA 
CTTGGAGATG ACGCATCCAA TATTGAAATA AGACTTGTAA AGGATGGTTC AGGCCTTGGT 
GCTGCAATAG CTGCTGCGTT TGCAGTAACA CAATAG

Protein sequence

MGSKLEIVQD VINAFEVNKE SMLRTAMLFK ETMEKSLNGE KTCLKMLPSY IGKPTGKEQG 
TFMTIDMGGT NFRCTKYKIN NGNFEKVGEI KQKLINKEKN YDLTKSDSDE KQLFGFMAEC 
IGELLEPEES LYLGNTFSFP CRQEGINDAY LIQWTKEITT SGVVGQNINK LLEQSLKEKN 
INVKPVAILN DTVGTLLVAM YSYQTADIGS IMGTGHNTCY LENNHPLNGQ KMIVNIESGN 
YNVGLPVTKY DEIIDKNSQI PGAQLLEKMV SGYYMGSLLK EVCKDLYKNN ALFTNEDVDI 
DAFFNQNFNA LMVENFILYP SNTKEQYKCS IEDAEIVKRV SEAILKRTVR LVAVSHMGIL 
FHQENSGTSV NNEHVIAIDG TIYEKMPNAP QLMKEAFREA LGDDASNIEI RLVKDGSGLG 
AAIAAAFAVT Q