Gene Moth_2410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2410
Symbol	argS
ID	3830777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2530410
End bp	2532092
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	60%
IMG OID	637830329
Product	arginyl-tRNA synthetase
Protein accession	YP_431235
Protein GI	83591226
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000917803
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATAG TACAGGAAAC CAAAAGGCGG CTCGCAGCGG CATTGACTGA TGCCGCTGCC 
ACGGCCAGGG CGGCCGGTGA AATTAGTTAC GATGAGCTGC CTGATTTTGT CATTGAGACG 
CCGCGGGATA AAACTCACGG CGACTTTGCT GCTAACCTGG CTTTATTGCT GGCCAGGCAG 
GCGCGGCAGT CCCCTCGCAA CGTAGCGGCA GCCATTGTGC GGCACCTGGA AAGGCCGCAA 
CCCGGCGTGG CCAGAGTTGA AGTGGCCGGA CCGGGCTTTA TTAATTTTAC CCTGGATAAC 
CAATGGTTGT TACCGGTGTT GCCGGCCGTC CTGGCGGAAG ACGACCACTA TGGGTGGTCC 
AATATCGGCC AGGGAGCCAA GGTCCAGGTG GAGTTCGTCA GCGCCAACCC CACGGGGCTT 
TTGCATATGG GTAATGCCCG CGGTGCCGCC CTGGGGGATA GTATTGCCAA CCTCCTCACG 
GCGGTAGGCT ATGACGTTAC CCGGGAATTC TATATCAACG ACGCCGGCAA CCAGATTGAG 
AATTTTGGCC TCTCCCTGGA GGCTCGCTAC CTTCAGGCCC TGGGCCAGGA AGCCTCTATA 
CCTGAGGACG GTTATCACGG CGAGGACCTG GTGGCTACCG TCGGCCGTTT TATCGCCAAG 
TACGGGGATA AGTACCTGGA TACAGATCCG GCCCTCCGGA GGGAGATGCT GGTCCGCTTT 
GCCCTGGAAG AAAAGCTGGA CGCCATCCGC CGGGCCCTGG AGGATTTCGG CGTAACCTAT 
GACGTCTGGT TCAGCGAGCA GTCTCTTCAC GACTCCGGCG CCGTCGCCCG GGCCATTGCC 
GACCTGGAAA AGGCCGGATA TATTTATGAA AAGGACGGGG CACTGTGGTT TAAGGCCACC 
AGTTTTGGCG ATGTTAAGGA CGAGGTGGTG GTGCGCAAGA ACGGCATCCC CACTTACTTT 
GCCGCCGATA TCGCCTACCA CCGCAATAAA TTCGAACGCG GCTTCGAGCG GGTAATAAAT 
ATCTGGGGCG CCGACCATCA CGGGCATGTA GCCCGCCTCA AAGGTGCTCT CCAGGCCCTG 
GGCTATGACC CCCGCCGCTT GGAAGTCGTC CTCATGCAAT TGGTGCGCCT CTATCAGGGC 
GGCGAAATCC TGCGCATGTC CAAACGTACC GGCCAGTACG TCACCCTGGA AGAACTAATT 
GAAGAGGTGG GCCGGGACGC GGCACGCTAC TTCTTTGTCA TGTTGAAGAG CGACAGCCAC 
CTGGAGTTCG ACCTGGACCT GGCCCGGTCC CAGTCGGCAG ACAACCCGGT GTATTACGTC 
CAGTACGCCC ATGCCCGTAT CTGCAGCATC CTGCGCCTGG CGAAGGATAG GGGCCTGGAA 
GTACCGCCGG CGCGGGAAGC CCGGCTGGAA CTCTTACAGG ACCCGGCTGA GCTGGAGTTG 
ATCAAGCAGA TTGCTGCCTG GCCGGACACC GTGGCCGGGG CGGCCCAGGC CCTGGAGCCC 
CACCGGTTGA CGCGCTTTGC CCACGATCTG GCCAGCCTGT TTCACAGCTT TTATACCAGT 
TGCCGGGTCC TGGCCGATGA CCCGGAGGTC CGCAAGGCCC GGCTGGTACT GGTGGAAGCG 
ACCCGGATCA CCCTGCGCAA CGTCCTGCAC CTCCTGGGAG TCACCGCCCC GGAGAGGATG 
TAG

Protein sequence

MNIVQETKRR LAAALTDAAA TARAAGEISY DELPDFVIET PRDKTHGDFA ANLALLLARQ 
ARQSPRNVAA AIVRHLERPQ PGVARVEVAG PGFINFTLDN QWLLPVLPAV LAEDDHYGWS 
NIGQGAKVQV EFVSANPTGL LHMGNARGAA LGDSIANLLT AVGYDVTREF YINDAGNQIE 
NFGLSLEARY LQALGQEASI PEDGYHGEDL VATVGRFIAK YGDKYLDTDP ALRREMLVRF 
ALEEKLDAIR RALEDFGVTY DVWFSEQSLH DSGAVARAIA DLEKAGYIYE KDGALWFKAT 
SFGDVKDEVV VRKNGIPTYF AADIAYHRNK FERGFERVIN IWGADHHGHV ARLKGALQAL 
GYDPRRLEVV LMQLVRLYQG GEILRMSKRT GQYVTLEELI EEVGRDAARY FFVMLKSDSH 
LEFDLDLARS QSADNPVYYV QYAHARICSI LRLAKDRGLE VPPAREARLE LLQDPAELEL 
IKQIAAWPDT VAGAAQALEP HRLTRFAHDL ASLFHSFYTS CRVLADDPEV RKARLVLVEA 
TRITLRNVLH LLGVTAPERM