Gene Moth_0722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0722
Symbol
ID	3830998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	751738
End bp	753537
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	61%
IMG OID	637828653
Product	aldehyde ferredoxin oxidoreductase
Protein accession	YP_429583
Protein GI	83589574
COG category	[C] Energy production and conversion
COG ID	[COG2414] Aldehyde:ferredoxin oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000472604
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.424629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGGTT GGACCGGACA GTTACTGCGC GTAAACTTGA GCAACGGTAA GTGCAGGACG 
GAAAGGTTAG ACCCGATCCT GGCCCGGGAT TACGTCGGCG CCAGGGGGCT GGCCAGCAAA 
ATTCTCTGGA ATGAAATTGA TCCTCAGGTC GACCCCCTGG CCCCGGAGAA CAAGCTCATA 
TTTATGACCG GGCCCCTCAC CGGGACTACG GCTATTTCCG GCAACCGTTA CAACGTCGTC 
ACCAAATCGC CCCTGACCGG CGCTATCGCC GCCTCCAGCT CCGGCGGTTA CTTTGGCAGC 
GAACTCAAGT ACGCCGGCTT TGATGGGATT ATCTTTGAAG GCCGGGCGCC CGAGCCTGTT 
TATCTCTGGA TTGAAGACGG TTCCTTTGAG TTGCGGCCAG CCGGCGAACT TTGGGGGAAA 
AACGTCCACG AGACGGAAGA CGCTATAAAA GCAGTCACCT GCCCCCATGC TAAAGTGGCT 
TGCATCGGCC CGGCTGGAGA GAAACTGGTT CGTTTTGCCT GTATAATGAA TGATAAAAAC 
CGGGCCGCTG GCCGTTCCGG TGTCGGCGCC GTCATGGGGT CCAAGAACCT GAAGGCCATT 
GCCGTCCGCG GTCACGGCGG GGTCAAGGTG GCCGATGGGC CGGCGTTCCG GGAAGCGGTC 
CTGGCGTCCC TGGCCAAGAT CAAGGCCAAT GATGTCACCC ACGGCGGCCT GCCCGCCTAC 
GGCACCGGGG TCCTGGTGAA TGTCATCAAC GCCCATGGAG GCCTGCCTAC CCGAAATTTT 
CAGACAGGCA TCTTTCCAGG AGCGGAAAAA ATCAGCGGTG AAGCCCTGGC GGCTACCTAC 
CTGGTGCGCA AGAAGGCCTG CCTGGCCTGC CCCATGGCCT GCGGCCGCGC CACGATGGTA 
CCTTCCGGTC CCTACGCCGG TCATGGTGAA GGGCCGGAGT ATGAGGCCCA GTGGTCCCTG 
GGGGCCGACT GCGGCATTGA TGACCTGGCG GCCATCCTCA AGGCTAACTT CCTGGCTAAC 
GAGCTGGGCT ATGACCCCAT TTCCTTCGGC TCTACCCTGG CCTGTGCTAT GGAACTATAT 
GAAAAGGGTT ACCTGCCGGC CGGGGATACC GAGGTGCCCC TGGAATTCGG CAATGCCGCC 
GTCATGGTGG AAACGGCCCG CAAGGTGGGC TACCGGGAGG GTATCGGCGA TCTGCTGGCG 
GAGGGTTCTT ACCGCCTGGC ATCACGCTAC GGTCATCCCG AACTCTCCAT GACCAGCAAA 
AAGCAGGAAT ACCCGGCCTA TGACCCGCGG GCCTTCCAGG GTATCGGCCT GAATTATGCC 
ACCTCCAACC GCGGCGGCTG CCACGTCCGG GGCTATACCA TCGCTGCCGA GGCCTTGGGT 
ACTCCTGTCC AGGCGGATCC CCTTTCTTCT GAGGGCAAAG CGGCCCTGGA TAAGGCCTTC 
CAGGATCTGA CCGCCCTGGT GGATGCAAGT GGTATCTGCC TCTTCACCAC CTTTGCCCTG 
GGGGCTCCGG ATGTCGCCAG CATGCTGGCG ACGGCCACCG GCGTGCCCTA CACTGAGGAA 
AGCGGCCTCC TGGCGGGTGA AAGGATCTAT AACCTGGAGC GTCTCTTTAA TTTCGCCGCC 
GGCTTAACTA AAGCCGACGA TACCCTGGCG CCGCGGCTAC TCAATGAACC CATGCCGGAG 
GGGCCGGCTA AAGGCAAGAC ATCCGCCCTG ACAAAGATGC TGGCCGAGTA CTACCAGTTG 
CGCGGCTGGG ACGAAGAAGG CCGGGTCACA GCAGCTACCA GGGAGAGATT GGGGCTGTAG

Protein sequence

MYGWTGQLLR VNLSNGKCRT ERLDPILARD YVGARGLASK ILWNEIDPQV DPLAPENKLI 
FMTGPLTGTT AISGNRYNVV TKSPLTGAIA ASSSGGYFGS ELKYAGFDGI IFEGRAPEPV 
YLWIEDGSFE LRPAGELWGK NVHETEDAIK AVTCPHAKVA CIGPAGEKLV RFACIMNDKN 
RAAGRSGVGA VMGSKNLKAI AVRGHGGVKV ADGPAFREAV LASLAKIKAN DVTHGGLPAY 
GTGVLVNVIN AHGGLPTRNF QTGIFPGAEK ISGEALAATY LVRKKACLAC PMACGRATMV 
PSGPYAGHGE GPEYEAQWSL GADCGIDDLA AILKANFLAN ELGYDPISFG STLACAMELY 
EKGYLPAGDT EVPLEFGNAA VMVETARKVG YREGIGDLLA EGSYRLASRY GHPELSMTSK 
KQEYPAYDPR AFQGIGLNYA TSNRGGCHVR GYTIAAEALG TPVQADPLSS EGKAALDKAF 
QDLTALVDAS GICLFTTFAL GAPDVASMLA TATGVPYTEE SGLLAGERIY NLERLFNFAA 
GLTKADDTLA PRLLNEPMPE GPAKGKTSAL TKMLAEYYQL RGWDEEGRVT AATRERLGL