Gene Moth_1247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1247
Symbol
ID	3833042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1288069
End bp	1289136
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	61%
IMG OID	637829183
Product	radical SAM family protein
Protein accession	YP_430104
Protein GI	83590095
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.421544
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGTCT GGAACTGCAC GCGGGACTGC AACCTCAAGT GCCGGCATTG TTATGCCGGT 
GCCGGGAGCG GGGTGGCCGG GGACGAAATG ACGACACCGG AGGCCAGGGA CTTCCTGGAC 
CAGCTGGTAG CTTTCCGGGT GCCGGTCCTC CTCTTATCAG GGGGCGAGCC CCTGGTACGG 
CCGGATATCT TTGACCTGAT GGCCACCGCC GTCAAGGGGG GACTGCGGGT CACCCTTTCC 
ACCAACGGCA CCCTTATTGA TCGCAGCACC GCCCGGGAAC TGAAAAAAAT CGGCATCAGC 
TATGTGGGTA TCAGCCTGGA TGGCATTGAG TCCAAACATG ACGCCTTCCG GGGCGTGAAG 
GGGGCCTTCC AGGCAACCCT GGAAGGCATC CGCAACTGCC TGGCGGTAGA CCAGCGGGTG 
GGCTTGCGCT TTACCATCAG CCGGGCCAAT GTCGACCAGC TGGAGGAAAT TTTTTACCTG 
ATCCGGGAAG AGAACATTCC CCGGGCCTGT TTCTACCACC TGGTTTACAG CGGCCGGGGC 
AGTGAACTGG CCGTTGAAGA CCTGAATCAT GAAGAAAGCC GGGCGGTTAT GGATTTTCTG 
ATTACAGCCG CCAGGCGCCT GAAAAAGCAG GGCCGGGAAG TCGAGATTTT AACGGTGGAC 
AATCATGCCG ACGGAATCTA CCTCTACCTG AAATTAATCC GGGAAGACCC GGAACGGGCG 
GTGGCCGTCC GGGAGCTATT GCGCCTGAAT GGCGGTAACC GCAGCGGTAT CGCCATCGGC 
GCCGTCGACT GGGCCGGTGC CGTCCATCCG GACCAGTTCA CCATGCACCA CATCCTGGGG 
AACGTCCGGG AACGCCCCTT CGGCGAGATA TGGACGGATC TCAGCAACCC CCTGCTGAAG 
GGCCTGCGGG ACCGCAAACC CCTGTTGAAG GGTCGCTGCC GTACCTGCGC CTGGCTGGAC 
TTGTGCAATG GCAACTGCCG CGCCCGGGCG GAAAGCGTCA CCGGCGACTT CTGGGAATCC 
GACCCAGCCT GTTATTTGAC GGACGGGGAA ATATCAGATA GGAGGTAG

Protein sequence

MVVWNCTRDC NLKCRHCYAG AGSGVAGDEM TTPEARDFLD QLVAFRVPVL LLSGGEPLVR 
PDIFDLMATA VKGGLRVTLS TNGTLIDRST ARELKKIGIS YVGISLDGIE SKHDAFRGVK 
GAFQATLEGI RNCLAVDQRV GLRFTISRAN VDQLEEIFYL IREENIPRAC FYHLVYSGRG 
SELAVEDLNH EESRAVMDFL ITAARRLKKQ GREVEILTVD NHADGIYLYL KLIREDPERA 
VAVRELLRLN GGNRSGIAIG AVDWAGAVHP DQFTMHHILG NVRERPFGEI WTDLSNPLLK 
GLRDRKPLLK GRCRTCAWLD LCNGNCRARA ESVTGDFWES DPACYLTDGE ISDRR