Gene Moth_1751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1751
Symbol
ID	3832896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1805870
End bp	1806892
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	637829675
Product	phenylalanyl-tRNA synthetase, alpha subunit
Protein accession	YP_430595
Protein GI	83590586
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0018761
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.793002
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGAAG TTATCGCCAA AATTCGGGAG GAAGCCCTGG CCCGGGTGGC AGCGGCCACC 
AGCAGCGAGG AACTGGAGGC CTTACGGGTC CGGTACCTGG GAAAAAAGGG TGAACTGACC 
CGGGTTTTAC GGGGGATGGG TAAACTTCCG CCTGAAGAGC GGCCCCGGGT AGGACAGATG 
GCCAACAAGG TACGGGAAGA GCTGGAAGGG GCTCTGAAAG AACACCGGGA GAATCTCTCC 
CGCCGCGAAC AGGCGGAGCG CTTGCGGGCG GAAGCCCTTG ATGTGACCCT GCCGGGACGT 
CCGGTTACCA GGGGCAACCG TCACCCCCTT TATCAGATAT TGAACGAAAT CAAGGCCGTT 
TTTATCGGCC TGGGGTTTGA CGTCGCCGAG GGGCCGGAGG TGGAGAGCGA CTACTATAAC 
TTTGAGGCCC TGAACTTACC CAAGGAGCAC CCGGCGCGGG ATATGCAGGA TTCCTTTTAC 
ATTACCGAAG ACGTACTCCT GCGTACCCAT ACCTCCCCGG TACAAGTGAG GGTGATGGAA 
GCGCGGCATC CCCAACTGCC AATCCGTATT ATTGCGCCGG GTAAAGTCTA CCGGCGCGAC 
GATGACGCCA CCCACTCCCC CTTGTTCCAC CAGGTGGAGG GCCTGCTGGT GGACCGGCGG 
GTGACCTTCG GCGACCTTAA AGGCACCTTG ATGGCTTTTT TAAAGCAGAT GTTCGGCGAA 
CAGGTCCGGG TGCGTTTCCG GCCCAGCTAT TTCCCCTTCA CCGAGCCCAG CGCGGAAGTA 
GATATGTCCT GCGTCATGTG CGGCGGCAGC GGCTGTCGTG TCTGTTCCCA CACCGGCTGG 
CTGGAGATCC TTGGCTGCGG TATGGTTCAC CCTAAGGTTT TAAGCATGTC CGGCTACGAC 
CCGGAGGAGG TCAGCGGCTT TGCCTTTGGC CTGGGCGTGG AGCGGGTGGC CATGCTGAAG 
TACGGCATCG ACGACCTGCG CCTCTTCTAT GAAAACGACC TGCGCTTCCT GCGGCAGTTT 
TAA

Protein sequence

MLEVIAKIRE EALARVAAAT SSEELEALRV RYLGKKGELT RVLRGMGKLP PEERPRVGQM 
ANKVREELEG ALKEHRENLS RREQAERLRA EALDVTLPGR PVTRGNRHPL YQILNEIKAV 
FIGLGFDVAE GPEVESDYYN FEALNLPKEH PARDMQDSFY ITEDVLLRTH TSPVQVRVME 
ARHPQLPIRI IAPGKVYRRD DDATHSPLFH QVEGLLVDRR VTFGDLKGTL MAFLKQMFGE 
QVRVRFRPSY FPFTEPSAEV DMSCVMCGGS GCRVCSHTGW LEILGCGMVH PKVLSMSGYD 
PEEVSGFAFG LGVERVAMLK YGIDDLRLFY ENDLRFLRQF