Gene Moth_1421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1421
Symbol
ID	3832249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1465669
End bp	1466751
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID	637829357
Product	O-methyltransferase family protein
Protein accession	YP_430277
Protein GI	83590268
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.513829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAATC ACCCGCAAAG TTTAATGGAC CTGGCTTGCC CCCAGGGGGT TGAAAGGATT 
GACAGCATTA CAGCCGGTTA TCAGGCTTAC CAGGTACTGA GGGCCGCCCT GGAACTGGGG 
CTGTTTGATT GGTTGGCGGA AAATGGTCCC GGCTGCCGGG AGGAGATCAC CACTGCCCTC 
AAGTTAAACG GCATGTTTAC CCGTAGTTTT CTCCAGGCCT TGGTGGACCT CGGCTTTTTA 
ACCTGCAAAG GCGAAAAATA CAGGTTAACC GAATTGGCGA GAGATTTCTT GGTGCGGCGG 
AGCCCTTGCT ACCAGGGAGA TCTATTCTTG AGCACCGCCC GGCCTGATTC CTGGTGGAAT 
AACTTTAAAG ACACCCTTAC CGTCATAAAA CCCCCGGAAC AGGACTTTGA TGCCGTTCCA 
ACCCCCGATT TTATTAAAGC CCTGGCCCAG CGTTCCCTCC GGGGAGAGTT GCAGGCAGTC 
ACCCGCAGCA TAGTCGCCTG GGAAGGGTTT AGAGGGGCCA GGACGCTCCT TGACCTGGGA 
GGCGGGCACG GTTTTTATGC CATAGCCCTG TGCCAGGTCA ATCCTAACCT CAGAGCCGTT 
GTTTTCGATA AACCCCACAT TATTGCCTGC ACCAGGGAAT TTATCCGGCA GTACGGCCTG 
GAAGACCGGG TGATAGTCCA GGGGGGCGAT GCGTGTTCGG AAGAATGGGG AGGAGGCTAT 
GATATAGTCC TTATTTCTCA TTTGCTTTAC AAGTACCGCA AAGAATTAGC GGCATTTATT 
GGTAAAGCCT TTACCGCCCT GAAGCCCGGC GGCCTGCTGG CGTGCAATCA CTGGTTCTGC 
GCCCCGGGTT GTGGATCAGA GGGAGATGGT TTGCGGGAAC TCGATAGATC CATCCATAGC 
TTTGGCCATC CCCTGTGCCA TATGGAGGAA TTCAATAACC TGTTGGCTAC TACCGGCTTT 
AGCCTGTGGC AGTTACTTGA TGTTCCCAGC GCCTATGGTA TGGCGAAATT GCACCTTGCT 
GTTAAAAAAG GATTGGCATC AACAAAGGCT ATGATGCCGG GGAGTTGCAG CGCCTGCTGC 
TAA

Protein sequence

MSNHPQSLMD LACPQGVERI DSITAGYQAY QVLRAALELG LFDWLAENGP GCREEITTAL 
KLNGMFTRSF LQALVDLGFL TCKGEKYRLT ELARDFLVRR SPCYQGDLFL STARPDSWWN 
NFKDTLTVIK PPEQDFDAVP TPDFIKALAQ RSLRGELQAV TRSIVAWEGF RGARTLLDLG 
GGHGFYAIAL CQVNPNLRAV VFDKPHIIAC TREFIRQYGL EDRVIVQGGD ACSEEWGGGY 
DIVLISHLLY KYRKELAAFI GKAFTALKPG GLLACNHWFC APGCGSEGDG LRELDRSIHS 
FGHPLCHMEE FNNLLATTGF SLWQLLDVPS AYGMAKLHLA VKKGLASTKA MMPGSCSACC