Gene Moth_0935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0935
Symbol
ID	3832936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	968417
End bp	970195
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	61%
IMG OID	637828866
Product	thiamine pyrophosphate enzyme
Protein accession	YP_429795
Protein GI	83589786
COG category	[C] Energy production and conversion
COG ID	[COG4231] Indolepyruvate ferredoxin oxidoreductase, alpha and beta subunits
TIGRFAM ID	[TIGR03336] indolepyruvate ferredoxin oxidoreductase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0199927
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGAAT TGCTCATGGG CAACGAAGCC ATAGCCAGGG GAGCGCTGGA GGCCGGTATC 
CGGGTGGCCA CCGCTTATCC CGGGACGCCG GCTTCGGAAA TCATGGTTAC GCTGATGCGT 
TTTGGTCCGG AGGCAGGAGT CTATACTGAA TGGTCCGTTA ACGAGAAAGT AGCCGTAGAA 
ATTGCTGCCG GCGCTGCCTA TGCCGGTGCC AGAGCCATGG CCAGTATGAA GCAGATGGGC 
CTCAATGTTG CCGCCGATGC CATCATGAGC CTGGCTTACA TCGGCGTCAA GGGCGGCCTG 
GTCCTGGTGG TGGCCGATGA TCCAGGCCCC CATAGTTCCC AGACAGAACA GGATACGCGC 
CTTTTCGCCC GCTTTGCCAA GCTGCCGGTC CTGGACCCCT CCTGTCCCCG GGAAGCCTAC 
GAAATGACCA AATACGCTTT TGATCTCTCG GAAACCCTAG GGCTGCCCGT CATTGTCCGT 
CCTACCACCC GTACCTGCCA TGCCTGCCAG GATGTTGCCT TAGGAACCAT TCCCCCCCGG 
CCTCCAGTAC CCGGCTTCGA GAAAGACCCG CGCTGGGTCA TTATGCCTTC CCTCTCGGCC 
AGGCAGCACG TCTGGTTGAA CCAGCAGCAG CTACGTGCCG GGGAGGAGTT CGCCAACAGT 
CCCTTTAACG AGGTCTACTA TAATGGCCCC GCCGGAGTTA TCACCAGCGG CCTGTCTTAC 
TACTACGTCA CCGAGGCCGG GGAGCGCCTG GGAGTAAAAC TATCCCTGTT AAAGATCGGT 
ACCCCCTACC CCTTGCCCGA AAAACTGGTG ATCGATTTTT TAAAGCAGGT TGAGCGGGTA 
CTCATCGTAG AGGAGCAGGA GCCTGTTGTC GAAGATCAAG TCATTCGCCT GGCCTGGCGC 
CACCGCCTGC CGGTAGAGAT AGACGGTAAA CACAACGGTT TTCTCCCCCG GGAAGGTGAG 
TTTAATCCCG ATATTGTCAC CGGGGCCCTG GCCAAGTTCC TGGCAATACA ACCGGCGGGT 
ACCCACGGCC GCCCCGGGAC ACCACCCCTG CCGGTGCGTC CGCCCCTACT CTGCGCCGGT 
TGTCCCCATC GCGGCTCCTT CTACGCCTTT AAACAGGCCG CCCGGGACCG TAAAGTCATC 
TTCACCGGCG ATATCGGCTG CTATACCCTG GGAGCGGCCC CGCCCCTGGA AGCCATGGAT 
ACCTGCCTGT GCATGGGAGC GGGCCTGGGT CTGGCCCAGG GCCTGGCGCG GGTCCAGCCA 
GATACCCGGC TGGTAGCCTT CGTCGGGGAC TCTACCTTTT TCCATGCCGG CTTGCCATCC 
CTTGTCAACG CCGTCCACCA GCAGACGCCC ATAGTTGTCG TCGTCCTTGA TAATGAAACC 
ACAGCCATGA CCGGGCACCA GCCCCACCCA GGCCTGGCCA CCGATACCCA CCATAAGAAG 
ATTGATATCA GCCAGGTAGG CCGGGCCTGC GGGGTAGAAA CTATCTTGAC CGCCGACCCC 
CTGAACCTGG AGGAAACCCT GACTGTAGCC AATCAGGCCC TGGCGGCCCC GGGACCCGTC 
CTGGTCATCC TAAGTCACCC CTGCCCGCAA GTAGCCAAAC CTGCGGGACG CTACCAGGTT 
GACCAAATCG CCTGTATCAG CTGTCATACC TGTATTAAAG AGCTTGGCTG CCCGGCCCTG 
AGGCCGGACG GCAACGGTGT TCAAATCGCA GCCACCTGTA CCGGCTGCGG CCTCTGTAGC 
CAGGTCTGCC CGGTGGCAGC CATCGAGGAG GTACTTTAA

Protein sequence

MPELLMGNEA IARGALEAGI RVATAYPGTP ASEIMVTLMR FGPEAGVYTE WSVNEKVAVE 
IAAGAAYAGA RAMASMKQMG LNVAADAIMS LAYIGVKGGL VLVVADDPGP HSSQTEQDTR 
LFARFAKLPV LDPSCPREAY EMTKYAFDLS ETLGLPVIVR PTTRTCHACQ DVALGTIPPR 
PPVPGFEKDP RWVIMPSLSA RQHVWLNQQQ LRAGEEFANS PFNEVYYNGP AGVITSGLSY 
YYVTEAGERL GVKLSLLKIG TPYPLPEKLV IDFLKQVERV LIVEEQEPVV EDQVIRLAWR 
HRLPVEIDGK HNGFLPREGE FNPDIVTGAL AKFLAIQPAG THGRPGTPPL PVRPPLLCAG 
CPHRGSFYAF KQAARDRKVI FTGDIGCYTL GAAPPLEAMD TCLCMGAGLG LAQGLARVQP 
DTRLVAFVGD STFFHAGLPS LVNAVHQQTP IVVVVLDNET TAMTGHQPHP GLATDTHHKK 
IDISQVGRAC GVETILTADP LNLEETLTVA NQALAAPGPV LVILSHPCPQ VAKPAGRYQV 
DQIACISCHT CIKELGCPAL RPDGNGVQIA ATCTGCGLCS QVCPVAAIEE VL