Gene Moth_0933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0933
Symbol
ID	3832934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	966547
End bp	967833
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	61%
IMG OID	637828864
Product	phenylacetate-CoA ligase
Protein accession	YP_429793
Protein GI	83589784
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGT CCGAAGCAAA AAACTGCCAA CGCAAGTTCG ACTACGATTG CCTGTACCGG 
CAGCAGGAAC CGCACTTGCA GGCCCTGGTG CAGCGCCTCT TTGCCCATTC CCCTTACTAC 
CGGGAAAAGC TGGCGGCGGC CGGCCTTACA CCCGGAGACA TCCGGACGGT AGCCGACCTG 
GAGCATGTCC CCCTGACGGA CAAATGGGAG CTACGCAATG GTAAACCCCT GGCCCTGATG 
GCCGTTCCCG AAGAAAAAGT CGTCCGCATC CACTCCTCTT CGGGAACTAC GGGTAAACCC 
ATTATCATTC CCTACACGGC CTACGACGTG GCCGTCTGGG CGCAGATGAT GGCCCGCTGC 
TTCGCCATGG CCGGGGTCAC CAACCGTGAC CGGGTCCAGG TTACCCCTGG GTACGGCCTC 
TGGACGGCGG GCATCGGCTT CCAGGCCGGT ATTGAGTACC TGGGGGCCAT GGTGATCCCC 
ATGGGACCGG GGAATACTGA AAAACAACTG GAGATGATGG TCGATCTCCA GGCTACCGTC 
CTTGCGGCCA CGGCTTCCTA CGCTCTCTTC CTGGCCGAAG AGATCGACCG CCGGGGCCTT 
AAGGATCAAC TGGCCCTACG GGTAGGGGTC CTGGGCTCCG AGCGCTGGGG CGAGAAGATG 
CGGCAGCGAA TTGAAGACCT TCTGGGCATC GAAACCTTTG ATATTTACGG CTTAACGGAG 
ATCTACGGCC CGGGCATCGG CATCGACTGC CCGGCCCATG AGGGTATTCA TATGTGGACG 
GATCACCTGC TCCTGGAGGT TATCGACCCG GCGACAGGCA AGCAATTACC TCCGGGGGAG 
ACTGGTGAGC TGGTGATAAC TACCCTCACC AAAGAGGGTA TGCCCCTCCT CCGTTACCGC 
ACCCACGACC TGACCTGCCT AAAGAGGGAA GCCTGCTCCT GCGGTTCGCC CTACCCCATG 
ATTGAGCGCG TCCTGGGCCG GACCGACGAC ATGGTCAAGA TCAAGGGTGT CAACATCTTC 
CCGGGCCAGG TAGATCATGT CCTCCACCTC ACCCCCGGCG CCGGGAGCGA GTACCAGCTT 
ATCCTCACCC GGCAGGAAGG TAAAGACCGG CTGCTGGTAA AAATAGAGTA CCTGCCCGGT 
TATGATGGTG AGTCCACGGC AGCCGAGTGT CGCCGCCAGA TCAAGACCCG GATCGGTATC 
CTTGCCGACG TGGAAGCCGT GCCCCTGGGA ACCCTGCCCC GCAGCGAAAA GAAAACCCGG 
CGCGTCTACG ACTACCGGGA GACTTAG

Protein sequence

MSLSEAKNCQ RKFDYDCLYR QQEPHLQALV QRLFAHSPYY REKLAAAGLT PGDIRTVADL 
EHVPLTDKWE LRNGKPLALM AVPEEKVVRI HSSSGTTGKP IIIPYTAYDV AVWAQMMARC 
FAMAGVTNRD RVQVTPGYGL WTAGIGFQAG IEYLGAMVIP MGPGNTEKQL EMMVDLQATV 
LAATASYALF LAEEIDRRGL KDQLALRVGV LGSERWGEKM RQRIEDLLGI ETFDIYGLTE 
IYGPGIGIDC PAHEGIHMWT DHLLLEVIDP ATGKQLPPGE TGELVITTLT KEGMPLLRYR 
THDLTCLKRE ACSCGSPYPM IERVLGRTDD MVKIKGVNIF PGQVDHVLHL TPGAGSEYQL 
ILTRQEGKDR LLVKIEYLPG YDGESTAAEC RRQIKTRIGI LADVEAVPLG TLPRSEKKTR 
RVYDYRET