Gene Moth_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0033
Symbol
ID	3830899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	33358
End bp	34449
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	637827966
Product	pyruvate flavodoxin/ferredoxin oxidoreductase-like
Protein accession	YP_428916
Protein GI	83588907
COG category	[C] Energy production and conversion
COG ID	[COG0674] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.80564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000011646
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGCAA AACCCATTGA AGGAGAGCAA AGGGCCTTTA TGACCGGCAA CGAGGTTGTC 
GCCTGGGCCG CCCTGGCGGC AGGGGCTGAC ATCATGTACG GTTACCCCAT TACGCCCCAA 
AACGAGATCA TGCACTACTG GACCCGCATG GCTCCCAGGT ACGACCGGGG TTTTTTACAG 
ACCGAGGACG AAATATCAGC CGGGTTTACT ACTGTGGGCG GGGTTCTGGC CGGCAAGAGG 
GCCTTTACGG CCACCGCCGG GCCGGGCAAT GTCCTCATGC AGGAGGCCAT GTCCATGGCC 
GAGATGATGC GCCTGCCCAC CGTGGTGGTC GTGACCCAGC GGGGCGGCCC TTCGACGGCC 
ACGGTCATCT ATTCCCAGCA GGAACTCAAC CTGACCTGTT TCGGCGGCAA TGGGGAGGGA 
CTCAGGATTG TTTATTCCAC CTCCTCCCAT CAGGACCTTT TTAACTATAC CATCAAGGCC 
TTCAACACTG CCTGGAAATA TCGTTTCCCT ACCTTTGTCC TGGGTGACGG TTACCAGTCC 
AAGATGAGGG AACCGGTAAC CATCTATGAC CCCGCCACCA GGGGTATTGT CATGGAAGAG 
TGCCGGCCGA TGGTAGGCCT GCCGGGTATA GCCGGGATAG ATCGTGAGCC TGCCCACCTG 
CGCAATACCT ACAACCTCGA GGATGAACTT TATGACCGGC TTAGCGCCTC AATTAAAGAC 
TACCAGGCCA TGCTCCCGGA AGTAGTCGAA TGGGAGGCCT ACGCTGTGGA CGATGCCGAG 
TTCCTGGTCA TTGCCCACGG AGTTGTTTCC AGGGCCGCCC GGGCAGCCGT AGACTCCCTC 
CGGGAAGCCG GCATCAAGGC CGGGTACTTC CGGCCCATTA CCCTTAGACC CTTCCCGGAG 
GAAGCCTTGC AGCCCCTGGC TGCCAGGGCG CAAAGGATCC TGGTGGTCGA GTCCGCCCAC 
GGCCAGCTGG AACGCCAGGT CAGGGCCAGC CTCTATGGCC TGGAAACACC CGTCAGCGGC 
TACCTGCGGC CGGGCATGGG CATAACCCCG GAGGAGATAA TCGGCGCCGT CCAACAAACT 
ATAAGGAGCT GA

Protein sequence

MAAKPIEGEQ RAFMTGNEVV AWAALAAGAD IMYGYPITPQ NEIMHYWTRM APRYDRGFLQ 
TEDEISAGFT TVGGVLAGKR AFTATAGPGN VLMQEAMSMA EMMRLPTVVV VTQRGGPSTA 
TVIYSQQELN LTCFGGNGEG LRIVYSTSSH QDLFNYTIKA FNTAWKYRFP TFVLGDGYQS 
KMREPVTIYD PATRGIVMEE CRPMVGLPGI AGIDREPAHL RNTYNLEDEL YDRLSASIKD 
YQAMLPEVVE WEAYAVDDAE FLVIAHGVVS RAARAAVDSL REAGIKAGYF RPITLRPFPE 
EALQPLAARA QRILVVESAH GQLERQVRAS LYGLETPVSG YLRPGMGITP EEIIGAVQQT 
IRS