Gene Cthe_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0354
Symbol
ID	4808503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	444274
End bp	445263
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	44%
IMG OID	640105768
Product	putative CoA-substrate-specific enzyme activase
Protein accession	YP_001036785
Protein GI	125972875
COG category	[I] Lipid transport and metabolism
COG ID	[COG1924] Activator of 2-hydroxyglutaryl-CoA dehydratase (HSP70-class ATPase domain)
TIGRFAM ID	[TIGR00241] CoA-substrate-specific enzyme activase, putative

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGAAAA CCTCGTATTA TCTGGGAATT GATGTCGGTT CGGTCAGCAC GAACCTTGTG 
GTAATCAATG AAAATGATGA GATAGTTGAA AAATTGTACT TAAGAACAAG CGGACAGCCT 
ATAAATGCAC TGAAAAATGG TATGAAGACA CTGTACCAAA GGCTTGGCAA GGACGTGAAA 
ATAAGAGGTG TGGGAACTAC AGGAAGCGGC AGGCAGCTTG CAAGCGTAAT TGTGGGAGCT 
GATATTGTCA AAAACGAGAT TACAACTCAC GCTATTGCGG CACAGAAACT TGTGCCTGAG 
GTAAGAACCA TAATAGAAAT AGGCGGGCAG GATTCAAAGA TAATTATTCT GAAAAACGGT 
ATTATTTATG ATTTTGCCAT GAATACCGTT TGTGCGGCGG GAACAGGCTC TTTCCTTGAC 
AGGCAGGCCG CAAGGCTTGA AATACCGATT GAAGAGTTCG GCTCGTTTGC ACTAAGGTCC 
AAGACTCCTG TAAGAATTGC AGGACGGTGT GCTGTATTTG CGGAATCGGA TATGATACAC 
AAACAGCAGA CCGGACACAG CGTTGAAGAT ATTATCAACG GTCTTTGCGA GGCATTGGTG 
AGGAATTATC TGAATAACCT GGCAAAAGGC AAAGACATCG AAGAACCCAT AGTCTTTCAG 
GGCGGAGTTG CCGCGAATGT GGGAATTGTA GCTGCTTTTG AAAGAGCAAT AGGAAAAAAG 
ATAATTATAC CTCAGCACTA TGATGTAATG GGAGCGTACG GAGCTGCGCT TATAGCAAAA 
GAAGAAATGA TGAAAAACGG CAAAAACACC AACTTCTTTG GTTTTGATAA TATCCACAAT 
GACTTTAGAG CCAGAAGCAT AGAATGTAAC GGCTGCTCCA ACATGTGCGA AGTAATTGAA 
ATAGTATCAA ATGATGCGGT TGTGGCATGC TGGGGAGACC GATGCGGAAA ATGGTCCGCG 
GTGAAAAAGG AAAATCAAAG TGTGGGGTGA

Protein sequence

MLKTSYYLGI DVGSVSTNLV VINENDEIVE KLYLRTSGQP INALKNGMKT LYQRLGKDVK 
IRGVGTTGSG RQLASVIVGA DIVKNEITTH AIAAQKLVPE VRTIIEIGGQ DSKIIILKNG 
IIYDFAMNTV CAAGTGSFLD RQAARLEIPI EEFGSFALRS KTPVRIAGRC AVFAESDMIH 
KQQTGHSVED IINGLCEALV RNYLNNLAKG KDIEEPIVFQ GGVAANVGIV AAFERAIGKK 
IIIPQHYDVM GAYGAALIAK EEMMKNGKNT NFFGFDNIHN DFRARSIECN GCSNMCEVIE 
IVSNDAVVAC WGDRCGKWSA VKKENQSVG