Gene Moth_1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1235
Symbol
ID	3833177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1275310
End bp	1276722
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	59%
IMG OID	637829170
Product	radical SAM family protein
Protein accession	YP_430092
Protein GI	83590083
COG category	[C] Energy production and conversion
COG ID	[COG1625] Fe-S oxidoreductase, related to NifB/MoaA family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATAACT TTCACCTGGC CCTAATGACA GCTTCCAGGT ACAATATCCT CCCCCTCACC 
TCCACCTGCA ACCTGGGCTG CCTTTTTTGC AGCCATCGCC AGAACCCCCC GGGAGTTGAA 
ACCTGGCGCC TGCAGCCACT CAAGGGCGAG GAGATAGACA ACCTCCTGGA TTACCTGGAC 
GGTGACCGAA AAATAGTAAT CGGCGAGTCA GCCACCCGGC TGATTGAGGG AGAACCTCTG 
ACTCATCCCG ATTTTCTGGC AATCATACGT AAAGTACGAC GGCGTTTTCC CCGGGCAAGG 
CTGGAGATTA CCACTAACGG CACCCTCTTA ACCCCGAACT TGATCAGAGA ACTGGCTGAT 
TTGCAGCCCC TGGAAATAAA TCTCTCCCTC AACAGTGCCA GCCCGGAGGG ACGCCGGCGG 
CTGATGGGAG ATAGGAATCC CGGTGCTGCT CTCCAGGCTC CCATGGCTTT ACAGCAGGCA 
GGGATAATCT ACCAAGGCAG CCTGGTGGCC TGTCCATGGC TGGTGGGCTG GGACGATTTT 
CGTGAAACTA TCCTCTACCT GGCCCGGGCG GGGGCCAGGA CCATCCGTGT TTTTTTACCC 
GGTTACACCC GGCTGGCTCC GCCAGAGCTA CGTTTTCCCC CTGGCCTCCG CCGGCAAATA 
GAGGAGGAGC TGGAACAACT CCGTTCTTTA ACCGATGTCC CCCTGTTACT GGAACCTCCT 
CTTCTTGACA ACCTGCTGCC GGAAATAGAA GGAGCTATCC CCGGAACGCC AGCAGCCAGG 
GCCGGGTTGA AGCGGGGCGA TCTGATCCTG GAAATAGATG GCCAAAAGCC CCGCAGCCGG 
GTAGAGGCTT ACCGGTGGGC CGCCGTCCCC GGCCGGCGGC GCCTCCTGGT CGGCAGGCAT 
CAGGGAAAAA ATTACGGCCC CGCTGAAATA AAGTTAACCG GCGGGCAACA AGTGAAAAAT 
ACGAGAAGCA GCTCAGAACT GGAGGGTATC CGGGGGGCAC TTTATGAGCT GGAGGTGGGT 
CGGGAGGGCA GCGGTTTGAC CTTTGCCTGG GATTTCGACC CGGACCTGCT GCCGGAAGTA 
GAAAAGGCAT GCCGGCGCCA CGGCGCCCGG AAGGTTTTAA TCCTTACTTC CAGGCTGGCT 
GTGGCAGTGA TAAAGGAGGC CGTGGCCCGA CTATCTCTTT CCCTGGAGGT AGTCGTCACC 
CCCAGCCGTT TCTTCGGCGG GTCCATCGGC TGTGCCGGCC TGTTAACCCT GGCTGATTTC 
CAGGCCGCCT GGCAGGATTG GCAGAAGAAT AATGGCCCGG CTGATCTCAT CATCCTCCCG 
TCCATCGCCT TCGACTACCG GGGACGGGAC CTGGTTGGTG AGCATTACCT GAGCCTGGCG 
GCAAGTACCG GCGTTCCAGT GGAACTGGTA TAA

Protein sequence

MDNFHLALMT ASRYNILPLT STCNLGCLFC SHRQNPPGVE TWRLQPLKGE EIDNLLDYLD 
GDRKIVIGES ATRLIEGEPL THPDFLAIIR KVRRRFPRAR LEITTNGTLL TPNLIRELAD 
LQPLEINLSL NSASPEGRRR LMGDRNPGAA LQAPMALQQA GIIYQGSLVA CPWLVGWDDF 
RETILYLARA GARTIRVFLP GYTRLAPPEL RFPPGLRRQI EEELEQLRSL TDVPLLLEPP 
LLDNLLPEIE GAIPGTPAAR AGLKRGDLIL EIDGQKPRSR VEAYRWAAVP GRRRLLVGRH 
QGKNYGPAEI KLTGGQQVKN TRSSSELEGI RGALYELEVG REGSGLTFAW DFDPDLLPEV 
EKACRRHGAR KVLILTSRLA VAVIKEAVAR LSLSLEVVVT PSRFFGGSIG CAGLLTLADF 
QAAWQDWQKN NGPADLIILP SIAFDYRGRD LVGEHYLSLA ASTGVPVELV