Gene Moth_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0152
Symbol
ID	3832382
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	146086
End bp	147555
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	57%
IMG OID	637828085
Product	lysyl-tRNA synthetase
Protein accession	YP_429033
Protein GI	83589024
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000016249
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTGG AAGCTGAAAA TGATTTAATG GCCGTAAGGC TGGAAAAGCT GCACCAGCTG 
CAGGAAGCCG GCATCGAACC CTACGGCGGC CCCTTCGAAG TCACCCACAG CACTACCGCC 
ATCCGGGAGC GCTTCGATGA ACTCGAAGGT CAGGAGGTAG CCCTGGCCGG TCGCCTCCTG 
GCTATCAGGA GCCACGGCAA GGCTTCCTTT GCTGATCTGC AGGACCGGGA GGGCCGCTTG 
CAACTTTACA TTCGCCTCGA TAATGTAGGT CCCGGGATTT ATGAACTGTT CCAAAAACTC 
GATATCGGCG ATATCGTCGG CGTCCGCGGC AAGGTTTTTC GTACCCATCG CGGCGAAATA 
TCAGTAGAAG TCCGTCAACT GACACTCCTG TGCAAGAGTT TACGCCCCCT GCCGGAGAAA 
TGGCATGGCT TGAAGGATGT CGACCTGCGC TACCGGCAGC GTTACCTGGA TCTGATTGTC 
AACCCGGAGG TCAAACAGGT ATTTATCACC CGGGCCCGGA TCATCCGCGC CATCCGGTCC 
TTCCTGGACA ACCGAGGCTT TTTGGAAGTA GAGACACCGA CCATGCATCC CATTGCCGGC 
GGCGCCGCTG CCAGGCCCTT TATCACCCAT CACAACGCCC TGGATATTGA CCTCTACCTG 
CGCATTGCCC TGGAACTGCA TTTAAAACGG CTGCTGGTGG GCGGCCTGGA AAAGGTCTAC 
GAAATGGGCC GCATTTTCCG CAATGAAGGC ATCTCCACCA AACACAACCC CGAGTTTACC 
ATGCTGGAGC TCTACCAGGC CTATGCCGAT TATTATGTCA TGATGGATCT GCTGGAGGAA 
ATGGTAGCCT ATGTCGCCCG GGAGGCTCTG GGTACCACTG TTGTTACCTA CCAGGGGGAC 
AGGCTGGATC TCACCCCTCC CTGGCCGCGG TTAACCATGC TGGAAGCTAT TAAGAAATAC 
TACGGCGTGG ACTTTGATCA GTTGCCCACG GCCGAGGACG CCCGGCGGGC AGCCATCAGC 
CTGGGCCTGG AGATAGAGCC GGGCATGGAG CGGGGGAAAA TAATCAACGA GGTCTTTGAA 
GCCACAGTCG AACCCCATCT TATTCAGCCG ACCTTCATCC TGGATTACCC GGTGGCCATA 
TCCCCGCTGG CCAAGCGAAA AAAAGAAAAC CCGGACTTTA CCTACCGCTT TGAAGCCTTT 
ATAGCCGGCA GGGAATTGGC CAACGCTTTC TCCGAGCTCA ATGACCCCAT CGACCAGCGA 
CGGCGCTTTG AAGCCCAGAT GGCTGAAAGG GCGGCCGGCG ACGAAGAGGC CCACATGATG 
GACGAAGACT TCTTGCAGGC CCTGGAGTAC GGCATGCCGC CTGCAGGGGG GATGGGCATC 
GGCATCGACC GCCTGGTCAT GGTTCTTACG GATTCGCCCT CCATCAGGGA CGTTATCCTC 
TTCCCCACTA TGCGGCCGAA GGAAGAATGA

Protein sequence

MKLEAENDLM AVRLEKLHQL QEAGIEPYGG PFEVTHSTTA IRERFDELEG QEVALAGRLL 
AIRSHGKASF ADLQDREGRL QLYIRLDNVG PGIYELFQKL DIGDIVGVRG KVFRTHRGEI 
SVEVRQLTLL CKSLRPLPEK WHGLKDVDLR YRQRYLDLIV NPEVKQVFIT RARIIRAIRS 
FLDNRGFLEV ETPTMHPIAG GAAARPFITH HNALDIDLYL RIALELHLKR LLVGGLEKVY 
EMGRIFRNEG ISTKHNPEFT MLELYQAYAD YYVMMDLLEE MVAYVAREAL GTTVVTYQGD 
RLDLTPPWPR LTMLEAIKKY YGVDFDQLPT AEDARRAAIS LGLEIEPGME RGKIINEVFE 
ATVEPHLIQP TFILDYPVAI SPLAKRKKEN PDFTYRFEAF IAGRELANAF SELNDPIDQR 
RRFEAQMAER AAGDEEAHMM DEDFLQALEY GMPPAGGMGI GIDRLVMVLT DSPSIRDVIL 
FPTMRPKEE