Gene Moth_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1446
Symbol
ID	3832615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1488131
End bp	1489276
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	49%
IMG OID	637829379
Product	2-hydroxyglutaryl-CoA dehydratase, D-component
Protein accession	YP_430299
Protein GI	83590290
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1775] Benzoyl-CoA reductase/2-hydroxyglutaryl-CoA dehydratase subunit, BcrC/BadD/HgdB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.629308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.054659
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAATC AACCACTGGC GTATTTTGAT GATTTGCGGG AAAGAAATGT CCTGGAAATC 
AAAAAGTTGA AAGACCAGGG GAAAAAGGTA GTTGGCACTT ATTGTGCCTT TACCCCCAAG 
GAACTCATCA TTGCCGCCGG TGCCATCCCA GTTTCCTTAT GTGGTACCAG GCAAGAACCG 
ATTCCCGAGG CTGAAAAAAT CCTTCCCCGG AACCTCTGTC CGTTAATTAA ATCCAGTTTT 
GGCTTTGCCA TTACCGGGAG TTGTCCTTAT TTTTATTTTG CCGACCTGCT TATTGCCGAA 
ACCACCTGTG ATGGCAAGAT CAAGATGTAC GAATTGCTCA GGGAATATAA ACCCATGCAT 
ATTCTCAATT TACCGCCCAC CTCGCTGGGC GAAGACGCCT TTGCCTACTG GTATAATGAA 
ATACTTAAAG CCAAAGAACG GCTGGAAAGG GAATTTGCTG TTGAAATCAC AACGGCAAAA 
TTGCAGGAAG CCATTCGCCT GGTTAATGAA GAACGCCGGG CTTTGCTGGA ATTTCATCGC 
TTAAACCGGC ACGACCCAGC ACCGTTATCG GGTTTGGATC TTTTGAAGGT GCTTTGGGCA 
AAGGGCTTTA CTCCCGATAT AGCCGCCGGT ACGGCCGTGA TTCGCCAGGT CACTCTGGCG 
GTAAAGGAAC AGATGGCCAG GGGCGTGTCT GCGGCACCAC CGGGCTCACC TCGAATACTC 
TTAACCGGTT GTCCGGTAGG CCTGGGTTCC GAGAAGGTGA TTAAACTCGT GGAGGCCGGG 
GGCGGGGTGG TTGTTTGCCT GGAATCCTGC AGCGGCATTA AAGCCCTGGA GCCCCTTGTG 
GATGAGGAAG GCGATCCCTT GCAGGCAATT GCTGCCAAGT ATTTGCAAGT ACCCTGTCCC 
TGTTTAACCC CCAATCGGGG CCGTCTAGAA TTGCTGGAAC GTCTTATTAA AGAATACAGG 
GTCGATGGGG TAATCGATCT CACCTGGCAG GCCTGCCATA CGTATAATAT TGAGTCTTAT 
AGCATTAAGA AATTGGTCCA GGAAAAAGAG GGACTGCCTT TTCTACCAAT TGAGACTGAC 
TATTCAACAA GTGACTTGCA GCAGCTCAAG GTCCGGATTG ACGCTTTCCT GGAAATGATT 
AAATAG

Protein sequence

MANQPLAYFD DLRERNVLEI KKLKDQGKKV VGTYCAFTPK ELIIAAGAIP VSLCGTRQEP 
IPEAEKILPR NLCPLIKSSF GFAITGSCPY FYFADLLIAE TTCDGKIKMY ELLREYKPMH 
ILNLPPTSLG EDAFAYWYNE ILKAKERLER EFAVEITTAK LQEAIRLVNE ERRALLEFHR 
LNRHDPAPLS GLDLLKVLWA KGFTPDIAAG TAVIRQVTLA VKEQMARGVS AAPPGSPRIL 
LTGCPVGLGS EKVIKLVEAG GGVVVCLESC SGIKALEPLV DEEGDPLQAI AAKYLQVPCP 
CLTPNRGRLE LLERLIKEYR VDGVIDLTWQ ACHTYNIESY SIKKLVQEKE GLPFLPIETD 
YSTSDLQQLK VRIDAFLEMI K