Gene Cthe_2442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2442
Symbol
ID	4809821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2912358
End bp	2913842
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	41%
IMG OID	640107856
Product	carbohydrate kinase, FGGY
Protein accession	YP_001038837
Protein GI	125974927
COG category	[C] Energy production and conversion
COG ID	[COG0554] Glycerol kinase
TIGRFAM ID	[TIGR01311] glycerol kinase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0259159
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATT TTTACGTTCT CAGCATAGAT CAGAGCACTC AAGGGACTAA AGCGGTTATT 
CTAAACGACT CTGGAATTAT TCAAGCAAGA CATGATCTCC CACATAAGCA AATCATAAAT 
GAAAATGGAT GGGTTTCCCA TGATCCGGAA GAAATCTATG AAAATGTAAT TAAGACCGTG 
AAAATGGTAG TGGAAAAAGC AGGCATAGAT AAAAACCGGA TTCTTTGCGT GGGAATTTCA 
AACCAGAGAG AGACAACAGT CGTATGGGAC AAGAAAACAG GCAAGCCTCT TTGCAATGCA 
ATTGTTTGGC AATGCAACAG AGCAAAAGAT ATTTGTGAAA GAATAAAAAA GGCGGGATAC 
GAGAATTGTA TAGCCGCAAA ATCGGGTTTA AAGCTTTCTC CGTATTATCC GGCCGGTAAG 
ATGACATGGT TTATGGAGAA TGTTCCGGAT GTAGACAAAA AAGCAGATGA CGGAGATGCG 
GCTTTTGGAA CAATAGATAG CTGGCTTGTT TATAAACTGA CAAAGGGAAA AAGTTATAAA 
ACCGATTATT CAAATGCCAG TCGTACCCAG CTTTTAAATT TAACCACACT GAAGTGGGAT 
GAACAACTCT GCGACATATT TGGAATACCG GTTAAAGCAC TTCCTGAGAT TTGTGATTCA 
AATTCAGTGT TTGGCGAAAC TGATTTTGAA GGTTATCTTG AAAAGCCCAT TCCAATCTGC 
GGGGTACTTG GGGATTCCCA TGGTGCGTTG TTTGGACACA ACTGCAGAAA AGAAGGTTCG 
ATAAAAGTTA CTTATGGAAC AGGCTCATCC GTTATGCTAA ACACGGGCAA CATACCGATT 
TTCAGCAAAC ATGGATTATC CACCTCTCTT GCCTGGGTAA TCGACGGAAA AGCTTCTTAT 
GTTCTCGAAG GCAATATTAA CTATACCGGT GCGGTTATTT CATGGCTTAA AGATGCTCTT 
GGATTGATTC AGTCTGCGAA AGAAACGGCT GAGTTGTCAA AAAGGGCAAA CCCAAATGAT 
GGAACTTATT TGGTTCCCGC ATTTACCGGT TTGGGGGCTC CGTACTGGAA AAGCGAAGCC 
AAGGCGATCA TTGCCGGAAT GAGCCGTTCG ACCGGCAAAG CAGAGCTGGT GAAAGCGGCT 
AATGAATCTA TTGCTTATCA AATTAATGAT GTTATTTTGG CAATGCGAAA AGATACGGGG 
TTGGAAATTT CGGAATTGTG TGTTGACGGA GGACCGACCA GGGATGATTA TCTGATGCAG 
TTCCAGAGCG ATATTTCTGA TGCAGATATT AAAATACCCA ATATTGAGGA GCTTTCTGCA 
ACAGGAGCGG CTTTTCTGGC CGGAATGTCA GCCAATCTGT ATGATGACAC CGTGTATAAT 
GCCATATCAT ATCGATTTTA CCATTCCAAA ATGAATTCTC AAGTACGCAA TGAAAAAGTT 
GATGGTTGGA AAGCAGCAGT AAATATGCTT TTAAGCAAGG AGTGA

Protein sequence

MNNFYVLSID QSTQGTKAVI LNDSGIIQAR HDLPHKQIIN ENGWVSHDPE EIYENVIKTV 
KMVVEKAGID KNRILCVGIS NQRETTVVWD KKTGKPLCNA IVWQCNRAKD ICERIKKAGY 
ENCIAAKSGL KLSPYYPAGK MTWFMENVPD VDKKADDGDA AFGTIDSWLV YKLTKGKSYK 
TDYSNASRTQ LLNLTTLKWD EQLCDIFGIP VKALPEICDS NSVFGETDFE GYLEKPIPIC 
GVLGDSHGAL FGHNCRKEGS IKVTYGTGSS VMLNTGNIPI FSKHGLSTSL AWVIDGKASY 
VLEGNINYTG AVISWLKDAL GLIQSAKETA ELSKRANPND GTYLVPAFTG LGAPYWKSEA 
KAIIAGMSRS TGKAELVKAA NESIAYQIND VILAMRKDTG LEISELCVDG GPTRDDYLMQ 
FQSDISDADI KIPNIEELSA TGAAFLAGMS ANLYDDTVYN AISYRFYHSK MNSQVRNEKV 
DGWKAAVNML LSKE