Gene Cthe_1956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1956
Symbol
ID	4810739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2330336
End bp	2331268
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	46%
IMG OID	640107372
Product	tagatose-6-phosphate kinase
Protein accession	YP_001038367
Protein GI	125974457
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1105] Fructose-1-phosphate kinase and related fructose-6-phosphate kinase (PfkB)
TIGRFAM ID	[TIGR01231] tagatose-6-phosphate kinase [TIGR03168] hexose kinase, 1-phosphofructokinase family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000247641
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAACAT CTGTGGCTCT CAACCCCGCA GTGGACAAAA TTTATTTTGT TGACAACTTC 
GAACCGGGAA GAATGTACCG GGTGCGGCAA ATGGTAAAAA CGGCCGGGGG AAAAGGTGTA 
AATGTTGCGC GGGTTGCCCG TATGTTGGGA GAAAATGTCC GGCTGACAGG CTTTAAAGGC 
GGAGAGACAG GTAACTGGCT GGAATCGCAG CTTAAGAAAC TGGGGGTCGT TACAAGATTT 
GTTGAAGTAT CCGGTGAGAC AAGAACAAAC AACAATATTA TAGACAGAGT AAGAGACAGT 
GAGACGGAAG TACTGGAGCC GGGGCCTTTT ATATCCGGCG AAGACATGGA AAAATTCATG 
GAGGTTTATA AAGAGGCTCT TTCCGATTCC AAGGTCGTTG TGCTGTCAGG CGGGCTTCCC 
CAGGGAGTGC CTGCATGCTG TTATAAGGCT CTTATTGAAG AGGCAAAAAA CTTTAATATT 
CCTGTTATAC TTGACAGCGG CGGAGATGCT TTAAAAGAAG GCATAAAGGC AAAGCCAAAT 
GTTATAAAAC CGAATTTGAG GGAATTGGGA AGTCTCATTC AAAAAGAATT AAGGGATATG 
GACGAAATTG TTGAGGCGCT GAAAGAAATT AATGCAGACG GAATAGATAT TTCAATGGTT 
TCCATGGGCG ACAAGGGAGC TGTTCTGTGC ACGAAAGATT TGTGCCTTAG AGTAAAAGTG 
CCGCATGTGG AGACGGTAAA CACCATAGGC TCCGGAGATG CCATGGTGGC AGGGTTTGCA 
GCGGGACTTG CAAGAGACAA AACAATGGAA GAGTGCCTAA GGCTTGCGGC AGCCTGCGGC 
GTGAGCAATG CGCGCTTTTT GGAAATCGGT GTTGTGGATA AGAATGAAGT CGAAATCCAA 
AAGAACAGAG TGGAAATTGA GAGAATATCT TGA

Protein sequence

MITSVALNPA VDKIYFVDNF EPGRMYRVRQ MVKTAGGKGV NVARVARMLG ENVRLTGFKG 
GETGNWLESQ LKKLGVVTRF VEVSGETRTN NNIIDRVRDS ETEVLEPGPF ISGEDMEKFM 
EVYKEALSDS KVVVLSGGLP QGVPACCYKA LIEEAKNFNI PVILDSGGDA LKEGIKAKPN 
VIKPNLRELG SLIQKELRDM DEIVEALKEI NADGIDISMV SMGDKGAVLC TKDLCLRVKV 
PHVETVNTIG SGDAMVAGFA AGLARDKTME ECLRLAAACG VSNARFLEIG VVDKNEVEIQ 
KNRVEIERIS