Gene Moth_2294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2294
Symbol
ID	3831326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2407780
End bp	2408778
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	58%
IMG OID	637830214
Product	radical SAM family protein
Protein accession	YP_431124
Protein GI	83591115
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1180] Pyruvate-formate lyase-activating enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGGCG TGACCGAAGC TGCGTATTAT GTAAAGCTGC CTGGAGAAAA GGTCGAGTGC 
CGCCTCTGTC CCCATACCTG TGTTATTGCT CCCGGAAAAA GGGGCGTCTG CCGGGTGCGG 
GAAAACCGGG AGGGCCGCCT TATTACCCGT AATTACGGCC GCTGTTCTTC CCTGGCCCTG 
GATCCCATCG AAAAAAAGCC CCTCTACCAC TTTTACCCCG GCAGTCTTAT CCTCTCAGCC 
GGCACCGTGG GCTGCAACTT CAGCTGTGAC TTCTGCCAGA ACTGGGAAAT AGCACAGCAA 
GAGCCCGAGA CGGTTGTCAT TTCTCCCGAT GACCTGGTCC GCAAAGCACG GGAGGTCGAC 
AGCCTGGGAA TAGCCTACAC CTACTCCGAA CCCCTGGTCT GGTTTGAATT CGTCCTGGCC 
ACGGCGCAGT TGGCCCGGAA TGCCGGGCTG AAGAACGTCA TGGTCACCAA CGGCTTTATC 
CGGCCGGAGC CCCTGAAGGA ACTCCTGCCC TGGATTGACG CCTGGAATAT TGATGTCAAG 
GGCTTCAGCC TGGAATTTTA TCGTAAGGTT GTCAAGGGCG ATTACCGCCC GGTGCTTAAG 
ACGGCGGCAG CAGCAGTGGA CTCCGGCAGC CATGTGGAGA TAACCACCCT CCTGGTTACC 
GGCCTCAACG ACGACTCGAC TGAACTGGAA GAACTGGTCA AGTGGGTGGC GACCAACCTG 
GGGGTGGATA CACCCCTCCA CTTCTCCCGC TATTTCCCCC GGTACCGCCT TGAGGCGCCG 
CCGACTCCCC TGGAAACTAT GCGTCGCGCC AGGGATATGG CCAGGAAGCA TTTGCATTAT 
GTTTATCTGG GTAATGTGGC CGATCCGGAG GCCAATAATA CCTATTGCCC GGTATGCGGT 
GAACTGGTCA TTCGCCGCAC CGGCTATCAC GTTTCCCTGC CCGGCCTAGA TGGCCGTATC 
TGCCGCTCCT GCGGCAGCGA GCTGGCGATT GTAAGATGA

Protein sequence

MHGVTEAAYY VKLPGEKVEC RLCPHTCVIA PGKRGVCRVR ENREGRLITR NYGRCSSLAL 
DPIEKKPLYH FYPGSLILSA GTVGCNFSCD FCQNWEIAQQ EPETVVISPD DLVRKAREVD 
SLGIAYTYSE PLVWFEFVLA TAQLARNAGL KNVMVTNGFI RPEPLKELLP WIDAWNIDVK 
GFSLEFYRKV VKGDYRPVLK TAAAAVDSGS HVEITTLLVT GLNDDSTELE ELVKWVATNL 
GVDTPLHFSR YFPRYRLEAP PTPLETMRRA RDMARKHLHY VYLGNVADPE ANNTYCPVCG 
ELVIRRTGYH VSLPGLDGRI CRSCGSELAI VR