Gene Amir_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_2089
Symbol	thrS
ID	8326278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	2310424
End bp	2312472
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	70%
IMG OID	644942639
Product	threonyl-tRNA synthetase
Protein accession	YP_003099880
Protein GI	256376220
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0441] Threonyl-tRNA synthetase
TIGRFAM ID	[TIGR00418] threonyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCCAGC CAAGTCCCGC ATCCGCACTC GCCCCGCCTC GCGTGGTGGT GACGGCGGGG 
ACCACCGCTG GGACCGCCGT GCGCGAGGCA GGGCTGCCCG GCAAGGGCCC TGACGCGATC 
GTGGTCGTCC GCGACGCCGA GGGCCACCTG CGCGACCTGT CCTGGACCCC GCAGGTCGAC 
GTGGAGGTCG AGGCGGTCGC CGCCGACACC GAGGACGGCC GCTCGGTCAT CCGGCACTCC 
ACCGCGCACG TGCTCGCCCA GGCCGTGCAG CAGCAGTTCC CCGAGGCCAA GCTGGGTATC 
GGCCCGCCGG TCAAGGACGG CTTCTACTAC GACTTCCAGG TCGACAGGCC GTTCACCCCG 
GAAGACCTCG CCGCGCTGGA GAAGCGCATG AAGGCGATCG TCAAGGGCGC GCAGCGCTTC 
ACCCGCCGCG TGGTCGAGTC GACCGACGCC GCGAAGGCCG AGCTGGCCTC CGAGCCGTTC 
AAGCTGGAGC TGGTCGACGT CAAGGGCGGC GTGGACACCG CCGAGGTCAT GGAGGTGGGC 
GGCGGCGAGC TGACCATCTA CGACAACCTC GACCCGCGCT CCGGCGAACG CGTGTGGGGC 
GACCTGTGCC GCGGCCCGCA CCTGCCCACC ACCAAGCACA TCCCGGCGTT CAAGCTCACC 
AGGGTCGCCG CCGCCTACTG GCGCGGCAAC GAGAAGAACC CGCAGCTCCA GCGCATCTAC 
GGCACCGCCT GGGAGTCGCA GGAGGCGCTG GACAAGCACG TCGAGCTGAT CGCCGAGGCC 
GAGCGCCGCG ACCACCGCAA GCTCGGCGTC GAGCTGGACC TGTTCAGCTT CCCCGACGAG 
ATCGGCTCCG GCCTCGCGGT CTTCCACCCG CGCGGCGGCA TCATCCGCAA GGCCATGGAG 
GACTACTCGC GGGCCCGGCA CGAGGCCGAG GGCTACGAGT TCGTCTACTC GCCGCACATC 
ACCAAGGGCA ACCTGTTCGA GACCTCCGGG CACCTCGACT GGTACCGCGA CGGCATGTAC 
CCGGCGATGC ACCTGGACGC CGAGCTCAAC GAGGACGGCA CGATCCGCCG CCCCGGCCAG 
GACTACTACC TCAAGCCGAT GAACTGCCCG TTCCACGACC TGATCTTCCG GTCGCGCGGG 
CGCTCCTACC GCGAGCTGCC GCTGCGCATG TTCGAGTTCG GCTCGGTCTA CCGCTACGAG 
AAGTCCGGCG TGATCCACGG CCTGACCCGC GTGCGCGGCA TGACGCAGGA CGACGCGCAC 
ATCTTCTGCA CCCTGGACCA GGTGCAGGAG GAGCTGAAGT CGCTCCTGGC GTTCGTGCTC 
GGCCTGCTGC GCGACTACGG CCTCGACGAC TTCTACCTGG AGCTGTCGAC CCGCAACGAC 
GAGAAGTACG TCGGCAGCGA CGAGCTGTGG GAGACGGCCA CCGAGACGCT GCGCGTCGCC 
GCCGAGGACT CCGGCCTCGA ACTCGTGCCC GACCCCGGCG GCGCGGCGTT CTACGGCCCG 
AAGATCTCCG TGCAGGCCAA GGACGCGCTC GGCCGCACCT GGCAGATGTC CACCATCCAG 
CTGGACTTCA ACCTGCCCGA GCGCTTCGAG CTGGAGTACA CCGGCCCGGA CGGCTCCCGC 
CAGCGCCCGG TGATGATCCA CCGCGCCCTG TTCGGCTCGA TCGAGCGGTT CTTCGGCGTG 
CTGACCGAGC ACTACGCGGG CGCGTTCCCG GCGTGGCTGG CCCCGGTGCA GGTCGTGGGC 
ATCCCGATCG CCGACGAGCA CGCCGACCAC CTGTTCGCGG TGGCCAAGGA GCTCAAGAAG 
CACGGCGTGC GGGTCGAGAT CGACGCCTCC GACGACCGGA TGCAGAAGAA GATCCGCAAC 
CACACCACGC AGAAGGTGCC GTTCATGCTG CTCGCGGGCG GCAAGGACGT CGAGTCCGGC 
GCGGTGTCGT TCCGGTTCCG CGACGGCACC CAGATCAACG GCGTCCCGGT CGAGCAGGCC 
GTCGCCACGG TCGTCGGCTG GATCTCCCGC CGCGAGAACG CCTCCCCCAC GGCGGAACTC 
GTCAAGTGA

Protein sequence

MSQPSPASAL APPRVVVTAG TTAGTAVREA GLPGKGPDAI VVVRDAEGHL RDLSWTPQVD 
VEVEAVAADT EDGRSVIRHS TAHVLAQAVQ QQFPEAKLGI GPPVKDGFYY DFQVDRPFTP 
EDLAALEKRM KAIVKGAQRF TRRVVESTDA AKAELASEPF KLELVDVKGG VDTAEVMEVG 
GGELTIYDNL DPRSGERVWG DLCRGPHLPT TKHIPAFKLT RVAAAYWRGN EKNPQLQRIY 
GTAWESQEAL DKHVELIAEA ERRDHRKLGV ELDLFSFPDE IGSGLAVFHP RGGIIRKAME 
DYSRARHEAE GYEFVYSPHI TKGNLFETSG HLDWYRDGMY PAMHLDAELN EDGTIRRPGQ 
DYYLKPMNCP FHDLIFRSRG RSYRELPLRM FEFGSVYRYE KSGVIHGLTR VRGMTQDDAH 
IFCTLDQVQE ELKSLLAFVL GLLRDYGLDD FYLELSTRND EKYVGSDELW ETATETLRVA 
AEDSGLELVP DPGGAAFYGP KISVQAKDAL GRTWQMSTIQ LDFNLPERFE LEYTGPDGSR 
QRPVMIHRAL FGSIERFFGV LTEHYAGAFP AWLAPVQVVG IPIADEHADH LFAVAKELKK 
HGVRVEIDAS DDRMQKKIRN HTTQKVPFML LAGGKDVESG AVSFRFRDGT QINGVPVEQA 
VATVVGWISR RENASPTAEL VK