Gene Moth_1370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1370
Symbol
ID	3832293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1415708
End bp	1416667
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	62%
IMG OID	637829306
Product	CoA enzyme activase
Protein accession	YP_430226
Protein GI	83590217
COG category	[I] Lipid transport and metabolism
COG ID	[COG1924] Activator of 2-hydroxyglutaryl-CoA dehydratase (HSP70-class ATPase domain)
TIGRFAM ID	[TIGR00241] CoA-substrate-specific enzyme activase, putative

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCTCTA TCTACCTGGG CATCGACGTT GGATCAGTAA GCACCAACGT CATTGCCCTG 
GATATAGACG GTAACTTACT CGCCTCCGTC TACCTTCGTA CCCGCGGCCA GCCTATCCCG 
GCCATCCAGG AGGGTTTACG AGAGATTAGG GCTACCCTGG GCCGAGAGGT GACTGTCGCT 
GGCGTCGGCA CAACAGGCAG CGGCCGGGGC CTGGCGGCCG TCATGACAGG GGCTGATGTC 
GTCAAAAACG AAATCACCGC CCATGCCGTA GCTGCCAGCC AGGTCGTACC CGGTGTCCAA 
ACGGTGCTGG AGATCGGCGG CCAGGACTCT AAAATAATCA TCCTGCGCCA GGGCGTAGTC 
ACCGACTTTG CCATGAATAC CGTCTGTGCC GCCGGCACCG GTTCCTTCCT GGACCAGCAG 
GCGGCCCGTT TGGGGATCCC CATCGAGAAT TTCGGTCGCC TGGCCCTGGG TGCCAAGAAC 
CCGGTGCGCA TCGCTGGGCG CTGCGCCGTC TTTGCCGAAT CCGATATGAT CCATAAACAG 
CAACAGGGCC ACCCCCTGGA TGATATCGTC GCCGGCCTGT GCGAGGCCCT GGTACGCAAC 
TACCTGAATA ACGTCGGTAA GGGTAAGGAG ATCCTGCCGC CGGTAGTCTT CCAGGGCGGG 
GTGGCGGCCA ACGCCGGTAT GCGCCAGGCC TTCAGTCGCG CCCTGGGGAC GGAGGTCATC 
GTCCCGGAGC ATTATGGTGT TATGGGCGCC TACGGGGCCG CCCTCCTGGC CCGGGAAGCC 
CGCCCGAAAA CGAGCGCTTT CCGGGGCTTT GAGCTTACCG AAAGGGACTT CCGGACCGGC 
GGTTTTGAAT GCCGGGGGTG TGCCAATCAC TGCGAAGTGG TGGAATTAAG GGAAGGAAAA 
GAGGTCCTGG CCCGCTGGGG CGACCGCTGT GGCAAGTGGA GCAATGCTGT AGCCGTCTAG

Protein sequence

MTSIYLGIDV GSVSTNVIAL DIDGNLLASV YLRTRGQPIP AIQEGLREIR ATLGREVTVA 
GVGTTGSGRG LAAVMTGADV VKNEITAHAV AASQVVPGVQ TVLEIGGQDS KIIILRQGVV 
TDFAMNTVCA AGTGSFLDQQ AARLGIPIEN FGRLALGAKN PVRIAGRCAV FAESDMIHKQ 
QQGHPLDDIV AGLCEALVRN YLNNVGKGKE ILPPVVFQGG VAANAGMRQA FSRALGTEVI 
VPEHYGVMGA YGAALLAREA RPKTSAFRGF ELTERDFRTG GFECRGCANH CEVVELREGK 
EVLARWGDRC GKWSNAVAV