Gene Moth_0059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0059
Symbol
ID	3830809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	58252
End bp	59277
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	64%
IMG OID	637827991
Product	electron transfer flavoprotein alpha and beta-subunits
Protein accession	YP_428941
Protein GI	83588932
COG category	[C] Energy production and conversion
COG ID	[COG2025] Electron transfer flavoprotein, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	79
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00122913
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACTACAG TCTCCAATGC CGAATATCGC GGCGTCTGGG TCTTTATCGA ACAGGTGGCC 
GGCGAACCGG CCCCGGTTTC GTGGGAGCTG CTTGGAGCCG GCCGACAACT GGCCGATGCC 
CTGGGAGTCG AACTGGCCGG CGTGCTCCTG GGTCAGGGAG TAGCGGGTCT GGTTAGTGAA 
GCCTGGGCCT ACGGGGCCGA CAGGGTCTAC CTGGTGGAAG ACCCTGTCCT GGGCCCATAT 
CGTACAGCTC CCTACGCCCG GGCCCTGGTG GAGCTGGTTC AACGCTACCG GCCAGAGATA 
CTGCTCCTGG GGGCCACCAG CCTGGGCCGG GATCTCTCCG GGGCCGTGGC CACAGCCCTG 
GGAACCGGCC TCACGGCCGA CTGCACCGGC TTGAATATAG ACCCCGCAAC CCGCCTGCTG 
GAACAGACCC GGCCGGCCTT TGGCGGCAAC GTCATGGCTA CCATTCTCTG TCAACGGCAT 
CGGCCCCAGA TGGCTACCGT CCGGCCCCGG GTCATGCCTC TGCCGCCCCG GCAGGAAGGC 
CGCCAGGGGG AGTTGGTACG GGTAGGAATA GCTTTAAAAG AGGAAGAGGC CCTGGCCACG 
GTCCTTAAGG TTATCGAAGA GAAGGGAAAG GCTATCTACC TCGACCGGGC GGAGATTATC 
GTTGCCGGCG GCCGGGGACT GGGGTCCAGG GAAAACCTGC GCCTCCTGGA AGAACTGGCC 
GGTGTCCTGG GGGGCACCCT GGGGGCTTCC CGGGCGGCAG TAGAAGCCGG CTGGCTGCCA 
CCGGAGTACC AGGTAGGCCA GACGGGTATT ACCGTCCGGC CAAAGGTATA TTTCGCCATC 
GGTATTTCCG GGGCCATCCA GCACCTGGTC GGCATGCAGA ACTCGGAAGT GATTGTGGCC 
ATCAACAAGG ACCCGGAGGC GCCCATCTTC AAGGTGGCTA CCTACGGTAT AATTGGCGAT 
TTCCAGGAGG TAGTACCGGC GCTGACGGAG GAGTTCCGCC GGCAGCTGGC AGCGAGATCC 
GCCTGA

Protein sequence

MTTVSNAEYR GVWVFIEQVA GEPAPVSWEL LGAGRQLADA LGVELAGVLL GQGVAGLVSE 
AWAYGADRVY LVEDPVLGPY RTAPYARALV ELVQRYRPEI LLLGATSLGR DLSGAVATAL 
GTGLTADCTG LNIDPATRLL EQTRPAFGGN VMATILCQRH RPQMATVRPR VMPLPPRQEG 
RQGELVRVGI ALKEEEALAT VLKVIEEKGK AIYLDRAEII VAGGRGLGSR ENLRLLEELA 
GVLGGTLGAS RAAVEAGWLP PEYQVGQTGI TVRPKVYFAI GISGAIQHLV GMQNSEVIVA 
INKDPEAPIF KVATYGIIGD FQEVVPALTE EFRRQLAARS A