Gene Moth_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1149
Symbol
ID	3833117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1180172
End bp	1181134
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	58%
IMG OID	637829080
Product	CoA enzyme activase
Protein accession	YP_430006
Protein GI	83589997
COG category	[I] Lipid transport and metabolism
COG ID	[COG1924] Activator of 2-hydroxyglutaryl-CoA dehydratase (HSP70-class ATPase domain)
TIGRFAM ID	[TIGR00241] CoA-substrate-specific enzyme activase, putative

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCCCT GTTACCTGGG TATTGATGTC GGTTCCGTCA GCACCAACGT GGTAGTCATT 
AGCGCCACAG GAGAGATTTT AAGCAGCCTG TATTTAAGGA CCCACGGCCA GCCTATCCAG 
GCCATCAAGG AGGGCCTGCG CCAGACGATG GCAGCCCTCC CCGGGGATGT CGAGATAGCC 
GGAGCCGGTA CTACCGGCAG CGGCCGCACC CTGGCGGGAG CAATTATCGG CGCAGATATT 
ATCAAAAACG AAATTACCGC CCATGCCGTC GCTTCCCGCC AGGAGGTCCC GGATGTCCAG 
ACCATCCTGG AGATTGGGGG CCAGGACTCG AAGATTATCA TCCTACGCCA GGGAGTAGTT 
ACCGATTTTG CCATGAATAC CGTCTGTGCC GCCGGTACAG GGTCCTTTCT GGATCAACAG 
GCGGCCCGGC TGGGGATTCC CATTGAACAC TTCGGCGACC TGGCTCTAAA ATCCCGCAAC 
CCGGTGCGTA TTGCCGGCAG GTGTACGGTC TTTGCCGAGT CCGATATGAT TCATAAACAG 
CAGATGGGGC ACAATACAGA AGATATCATT GGCGGGCTGT GTGAGGCCCT GGTTCGCAAC 
TACCTGAACA ATGTCGCCAA AGGTAAGGAG ATCCTGCCGC CCATTGTCTT CCAGGGCGGG 
GTGGCTGCCA ATGCCGGAAT CCGGGCTGCC TTCGCCAAGG CCTTGGGGCA GGAGATCATC 
GTTCCCCGTC ACTTTGCCGT TATGGGCGCC CTGGGGGCAG CCCTCCTGGC CCGGGATTAT 
GTAGCCAAAC ACCCGGGAAC AAGATTCAAG GGCTTTGAGG TTTCCGAGGA GGACTACCAG 
GCCCGGAGTT TTATCTGCCA GGGATGTTCC AACCTGTGTG AAATTGTCAA CATCGAAGCC 
GACGGGCAGT TAATTGCCCG CTGGGGCAGT CGCTGTGGCA AATGGGATAC CCTGGGTGAA 
TGA

Protein sequence

MQPCYLGIDV GSVSTNVVVI SATGEILSSL YLRTHGQPIQ AIKEGLRQTM AALPGDVEIA 
GAGTTGSGRT LAGAIIGADI IKNEITAHAV ASRQEVPDVQ TILEIGGQDS KIIILRQGVV 
TDFAMNTVCA AGTGSFLDQQ AARLGIPIEH FGDLALKSRN PVRIAGRCTV FAESDMIHKQ 
QMGHNTEDII GGLCEALVRN YLNNVAKGKE ILPPIVFQGG VAANAGIRAA FAKALGQEII 
VPRHFAVMGA LGAALLARDY VAKHPGTRFK GFEVSEEDYQ ARSFICQGCS NLCEIVNIEA 
DGQLIARWGS RCGKWDTLGE