Gene Moth_1198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1198
Symbol
ID	3832965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1232709
End bp	1233680
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	57%
IMG OID	637829131
Product	acetyl-CoA decarbonylase/synthase complex subunit delta
Protein accession	YP_430055
Protein GI	83590046
COG category	[C] Energy production and conversion
COG ID	[COG2069] CO dehydrogenase/acetyl-CoA synthase delta subunit (corrinoid Fe-S protein)
TIGRFAM ID	[TIGR00381] CO dehydrogenase/acetyl-CoA synthase, delta subunit

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCC AGATTTTACG TGATCGTAGC CGAGCTGCCG TCCAGAAAGT TGTCCTGGGC 
GCCACCAAAG ACCAGGGGGG TACCCGCAGC CATACCATCG TCGTCGGTGG CGATGCTGCC 
CTGCCTTTCC ACCATTTCGA AGGAGAGATT GTCAACAGGC CGGTAATCGG TATGGAAGTG 
CAGGATATCG TACCCGACTG GCCCGACGTT CTCAAAGATC CCTTCACCGA TGTTATTAAT 
GAACCAGGGC GCTGGGCCCA AAAGTGCGTA GCCGAGTATG GTGCTGACCT TATCTACCTG 
AAACTTGACG GGGCCGACCC CGAAGGCGCC AACCATTCTG TGGACCAGTG CGTAGCTACT 
GTTAAAGAGG TCCTGCAGGC CGTGGGGGTA CCCCTGGTAG TGGTAGGTTG CGGCGATGTG 
GAAAAGGACC ATGAGGTCCT GGAAGCAGTA GCCGAGGCTG CTGCCGGCGA GAATCTCCTC 
CTGGGTAACG CTGAACAGGA AAACTATAAA TCCCTAACGG CAGCCTGCAT GGTCCACAAG 
CATAATATCA TCGCCCGTTC GCCCCTGGAT ATTAACATTT GTAAACAACT CAACATCCTG 
ATCAATGAAA TGAACCTGCC CCTGGATCAT ATCGTCATCG ACCCGTCCAT CGGCGGCCTG 
GGTTATGGTA TTGAATACTC CTTCTCGATT ATGGAACGCA TCCGTCTGGG GGCCCTGCAG 
GGAGATAAGA TGCTCTCCAT GCCGGTCATC TGCACCGTAG GCTATGAGGC CTGGCGCGCC 
AAGGAAGCCT CGGCACCGGT GAGCGAATAC CCGGGCTGGG GTAAGGAAAC CGAGCGTGGC 
ATCCTCTGGG AAGCCGTTAC CGCCACTGCC CTGCTCCAGG CCGGCGCCCA CATCCTCCTC 
ATGCGCCATC CGGAAGCCGT AGCCAGGGTG AAGGAGAATA TCGACCAGTT AATGGTGAGC 
AACGCCTATT AA

Protein sequence

MAVQILRDRS RAAVQKVVLG ATKDQGGTRS HTIVVGGDAA LPFHHFEGEI VNRPVIGMEV 
QDIVPDWPDV LKDPFTDVIN EPGRWAQKCV AEYGADLIYL KLDGADPEGA NHSVDQCVAT 
VKEVLQAVGV PLVVVGCGDV EKDHEVLEAV AEAAAGENLL LGNAEQENYK SLTAACMVHK 
HNIIARSPLD INICKQLNIL INEMNLPLDH IVIDPSIGGL GYGIEYSFSI MERIRLGALQ 
GDKMLSMPVI CTVGYEAWRA KEASAPVSEY PGWGKETERG ILWEAVTATA LLQAGAHILL 
MRHPEAVARV KENIDQLMVS NAY