Gene Moth_1245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1245
Symbol
ID	3833040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1285978
End bp	1286985
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	63%
IMG OID	637829181
Product	radical SAM family protein
Protein accession	YP_430102
Protein GI	83590093
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.394622
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTTTAT CCTGGAATAC GACCAACCAG TGCAATCTTT ACTGCGATCA CTGCTACCGG 
GATGCCGGCG CCAGGGTAGA GGACGAGTTG ACCACCGCCG AGGCCGGCAA TCTAATAGAC 
GAAGCCGCCA AAGCCGGCTT TAGGATTATG ATCTTTAGCG GCGGCGAACC CCTGCTGCGG 
CCCGACCTGC CGGAGCTGGT GAGCCGGGCG GCAGCCAGGG GGTTGCGCCC GGTCCTGGGA 
AGCAATGGTA CCCTCCTCAC CACCGAACTG GCCCGAGAAT TAAAGGCTGC CGGAGCCCTG 
GCCGTTGGCA TCTCCCTGGA CAGCTGCGAT CCCGCCCGCC ACGACCGCCT GCGGCAAAAG 
GAGGGTGCCT GGCGAAAGGC CGTCGCCGGA ATGGCGGCCT GCCGGGAAGC CGGCCTTCCC 
TTCCAGGTCC ATACAACTGT ATTTGATTGG AATCAGGACG AACTGGAAAA ACTGACCGAT 
CTGGCGGTGG AACTGGGAGC CGTGGCCCAT CACTTCTTTT TCCTGGTGCC CACCGGCCGG 
GCAGCGAGTA TCGAAGCCGA GTCGCTGCGG GCCGCCGAAT ACGAGGCCAC CCTTAAACGC 
ATTTTACAAA AGCAGCAACA GGTGAAGATC GAGTTAAAGC CTACCTGTGC TCCCCAGTTT 
ATGCGTCTGG CCCGCCAGCT GGGGATACCG GTGCGCTACC AGCGCGGCTG CCTGGCCGGT 
ATCGCCTATT GCATCATCAG CCCCCGGGGG GATGTCCAGC CCTGCGCCTA CTTGAACCTG 
CCGGTGGGCA ACGTGCGGGA GGTACCCTTC AGCCAACTCT GGCGGGAGAG CCCGGTCTTC 
CAGCGCCTGC GCACGGAAGA GTACAGCGGC GGTTGCGGTC GCTGCGGCTA TAAAAAGATA 
TGCGGCGGCT GCCGGGCCCG GGCCTGGTAT TATCACGGCG ATTATATGGC CGAAGAACCC 
TGGTGCCTCT ACCAGGGCCG GCAGGACGCG GCGGCGCACG ACAATTAA

Protein sequence

MLLSWNTTNQ CNLYCDHCYR DAGARVEDEL TTAEAGNLID EAAKAGFRIM IFSGGEPLLR 
PDLPELVSRA AARGLRPVLG SNGTLLTTEL ARELKAAGAL AVGISLDSCD PARHDRLRQK 
EGAWRKAVAG MAACREAGLP FQVHTTVFDW NQDELEKLTD LAVELGAVAH HFFFLVPTGR 
AASIEAESLR AAEYEATLKR ILQKQQQVKI ELKPTCAPQF MRLARQLGIP VRYQRGCLAG 
IAYCIISPRG DVQPCAYLNL PVGNVREVPF SQLWRESPVF QRLRTEEYSG GCGRCGYKKI 
CGGCRARAWY YHGDYMAEEP WCLYQGRQDA AAHDN