Gene Moth_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1201
Symbol
ID	3832968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1236379
End bp	1237719
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	56%
IMG OID	637829134
Product	acetyl-CoA decarbonylase/synthase complex subunit gamma
Protein accession	YP_430058
Protein GI	83590049
COG category	[C] Energy production and conversion
COG ID	[COG1456] CO dehydrogenase/acetyl-CoA synthase gamma subunit (corrinoid Fe-S protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTGA CGGGACTGGA GATTTACAAG CAGCTACCCA AAAAGAATTG TGGCGAGTGC 
GGGACACCCA CCTGTCTGGC CTTCGCCATG AACCTGGCCT CCGGAAAGGC CAGCCTTGAT 
TCCTGTCCGT ATGTTTCAGA TGCCGCCCGG GAGGCCCTGG ACGCGGCCGC GGCACCACCC 
ATTGCCAAGG TAGTCCTGGG CGCCGGGCCG ACTGCCGTAG AAATGGGGGA TGAGACGGAA 
CTCTTCCGCC ATGATAAACG TTTTTACCAT GAAACCGCCA TTGCCATCCA GGTTAGCGAC 
AACTTGAGCA GTGAAGAACT GAAGGCTAAA GTCGAAGCTA TAAATGGCCT GAACTTCGAC 
CGGGTGGGCC AGCACTACAC CATCCAGGCC ATAGCCATCC GCCATGATGC CGATGACCCT 
GCTGCTTTCA AGGCAGCGGT AGCCAGTGTA GCCGCCGCTA CCCAGTTAAA CCTTGTCCTT 
ATGGCCGATG ATCCTGACGT ATTAAAGGAA GCCCTAGCAG GAGTAGCCGA CCGCAAGCCC 
CTCTTATATG CCGCCACCGG CGCTAATTAC GAAGCCATGA CCGCCCTGGC CAAAGAAAAC 
AACTGCCCCC TGGCCGTCTA TGGTAACGGT CTGGAGGAAC TGGCCGAACT GGTAGATAAA 
ATCGTTGCCC TGGGCCACAA GCAGTTGGTC CTCGATCCCG GTGCCAGGGA GACCTCCAGG 
GCCATCGCGG ATTTCACCCA GATCCGCCGC CTGGCCATTA AGAAACGTTT CCGTTCCTTC 
GGTTATCCCA TTATCGCCCT TACTACTGCT GCCAATCCAT TAGACGAGGT ACTCCAGGCA 
GTTAACTATG TGACCAAGTA TGCTAGCTTG GTGGTTTTAC GCACCGATGC CAAAGAACAC 
CTGCTCCCCC TCTTGTCCTG GCGCCAGAAC CTCTACACCG ACCCCCAGGT TCCCATCAGG 
GTAGAGGAGA AACTGAATGA AATCGGTGCC GTCAACGAGA ATTCGCCGGT CTACGTAACC 
ACCAACTTCT CCCTGACCTA TTACTCCGTC GAGGGCGAGA TCGAGAGCAC CAAGATCCCC 
AGTTACCTGC TCTCGGTGGA TACCGACGGA CTGTCAGTCT TGACGGCCTA TGCCGATGGT 
AAATTTGAAG CCGAGAAAAT CGCCGCCGTT ATGAAAAAGG TGGACCTGGA CAATAAGGTT 
AAACGCCACC GGATCATTAT TCCCGGGGCT GTCGCCGTCC TGAAGGGCAA ACTGGAAGAC 
TTAACTGGAT GGGAAGTTAT CGTTGGCCCC AGGGAAGCCA GCGGCATCGT GGCCTTTGCC 
CGGGCCAACC TGGCTTCATA G

Protein sequence

MPLTGLEIYK QLPKKNCGEC GTPTCLAFAM NLASGKASLD SCPYVSDAAR EALDAAAAPP 
IAKVVLGAGP TAVEMGDETE LFRHDKRFYH ETAIAIQVSD NLSSEELKAK VEAINGLNFD 
RVGQHYTIQA IAIRHDADDP AAFKAAVASV AAATQLNLVL MADDPDVLKE ALAGVADRKP 
LLYAATGANY EAMTALAKEN NCPLAVYGNG LEELAELVDK IVALGHKQLV LDPGARETSR 
AIADFTQIRR LAIKKRFRSF GYPIIALTTA ANPLDEVLQA VNYVTKYASL VVLRTDAKEH 
LLPLLSWRQN LYTDPQVPIR VEEKLNEIGA VNENSPVYVT TNFSLTYYSV EGEIESTKIP 
SYLLSVDTDG LSVLTAYADG KFEAEKIAAV MKKVDLDNKV KRHRIIIPGA VAVLKGKLED 
LTGWEVIVGP REASGIVAFA RANLAS