Gene Cthe_3168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3168
Symbol
ID	4809618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3743985
End bp	3744863
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	42%
IMG OID	640108601
Product	putative lipid kinase
Protein accession	YP_001039556
Protein GI	125975646
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAG CTTTATTGGT TTACAATCCT TTTTCGGGAG ACAGGGGAAT AGCAAATAAA 
TTGGATTATA TTCTGGAGAG ATTTCAGCAA AAAGATATTT TGCTTCAGCC TTACAGGATT 
ATGGAAGGAT GCGGTAAGAA CATCTCCGAC CTTTTGACAG AAGGTTCCTA TAAGTTTGTA 
ATATCCTCCG GAGGGGACGG TACGCTGAAC TTTATCTGTA ATATTATTAT GAAGAATAAC 
CTCTCTGTGC CCATGGGAAT AATTCCTGCA GGAACCTGCA ATGATTTTGC TTCGATATTG 
AATATCCCGA CATCGGTTGA AGAGTGCGTG GACATCATTT TAAAAGGCAG GACGGTGGAT 
GTGGACGTAG GGGTTGTGGA TGACAGGATT TATTTTTTGA GCTCTTGCGC CGGAGGTGTT 
TTTGTGGATG TTTCTTTCAG TACGGACGGC GAGCTTAAAA AGAACCTGGG TGCCCTGGCT 
TATTATCTGA AGGCGCTTAC CGAAATGGCA AGCATGAAGC CCTTTAGAGT AACCATTGAA 
ACCGAAGAGG AAATTTTTGA AGATGACATA CTTCTTTTCT GCATTCTGAA CGGCAACCAG 
GCCGGCGGCT TTCACAACCT TATGGACGCG GTTTACGATG ACGGGCTTAT GGATATTGTC 
ATTATCAAAG ACTGCAGAAA AATAGAACTT CCGGCTATTT TCTATAAAGT TATAAACAAT 
GAGCTGCAAA ACGACAAGAA TGTGGTTACC ATAAGAACGA ACCGGTGTAC CATAAAGAGC 
TCGAAAGAAA TAGTACTTAG CATTGACGGG GAAAAGGGAC CGACCCTGCC GGTCGAGGTA 
AAATTTATAA ACAAGGCATT AAAAGTATTT GCGGCATAG

Protein sequence

MDKALLVYNP FSGDRGIANK LDYILERFQQ KDILLQPYRI MEGCGKNISD LLTEGSYKFV 
ISSGGDGTLN FICNIIMKNN LSVPMGIIPA GTCNDFASIL NIPTSVEECV DIILKGRTVD 
VDVGVVDDRI YFLSSCAGGV FVDVSFSTDG ELKKNLGALA YYLKALTEMA SMKPFRVTIE 
TEEEIFEDDI LLFCILNGNQ AGGFHNLMDA VYDDGLMDIV IIKDCRKIEL PAIFYKVINN 
ELQNDKNVVT IRTNRCTIKS SKEIVLSIDG EKGPTLPVEV KFINKALKVF AA