Gene Acid345_4736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4736
Symbol	thrS
ID	4070674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5597947
End bp	5599926
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	58%
IMG OID	637986780
Product	threonyl-tRNA synthetase
Protein accession	YP_593809
Protein GI	94971761
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0441] Threonyl-tRNA synthetase
TIGRFAM ID	[TIGR00418] threonyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.556159
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACC AAATCAAAGT AAAACTCCCC GACGGAAGCG TAAAAGAAGT CTCCAAAGGC 
ACCACTGCCC TCGATATCGC AAAAGGCATC AGCCCGCGCC TGGCCGACGC CGCTTTGGCC 
GCGAAGGTCG CACCGCTTCC ACACAACGGC GACCAGCCCG AAGCAAGGCT CGTGGACCTG 
ACTCGTCCGC TTGAAGAAGA CAGCGAACTG AAACTCCTCA CCGATCGCGA CCCCGAAGCG 
CTCGAGGTCT ATCGCCACTC GTCCGCGCAC TTGCTGGCGG CAGCCGTACT CGATCTCTTC 
CCGGAAACCA AGCTCGGCCA TGGTCCCTCC ACCGAGAACG GTTTCTTCTA CGATTTCTAT 
CGGCAAACGC CGTTCACCCC CGAAGACCTC GAGAAGATCG AGAAGCGCAT GCAGGAGTTG 
GTGAAGGAAG ACGTGCCTTA CGCGCGTGAG TTCCTGCCCC GAGAGGAAAG TCTGGAGCGC 
TTCAAGACCG AAGGCGACTT CATGAAGTGC CACTTCATCG AACAGTTCAC CAAGCCCGAT 
GAAAAGATCT CGATTTATAA GACCGGCAAG TTCCTCGACT TTTGCCGCGG CCCGCACATT 
CCCTCGACCG GGAAGATCAA GGCGTTCAAG CTGCTGAATA TCGCCGGCGC CTACTGGCTC 
GGCGACGAGA AGAACCCGCA ACTCCAGCGC ATCTATGGCA CCTCGTTCTT TTCGAAGAAA 
GACATGGACG AGTACTTCGC CAAGCTGGAA GAAGCGAAGA AGCGCGATCA TCGCGTGCTC 
GGCAAGCAGC TCGATTTGTT CTCGATTCAA GAACTCGCCG GCCCCGGGCT GATCTTCTGG 
CATCCGAAGG GCGGCATCAT TCGCAAGGAG ATGGAAGACT GGATGCGCGA GGAGTATCTG 
AAACGCGGAT ACTCGCTCGT CGTAACTCCG CATGTGGCGC GCACCGACCT CTGGAAGATC 
AGCGGCCACA CCGGTTATTA CAAGCAGAAC TTCTTCACGC CCATGGAACT CGATGATGCC 
GAGTACATGC TGAAGCCGAT GAACTGCCCC GGCCATGTCC TCATTTATCG TGACCAGCTC 
CGTTCCTATC GCGATCTGCC CATGCGTCTC GGTGAGATGG GAACGGTATA CCGCTACGAG 
CGCTCCGGCG TGATGCACGG GTTGTTGCGT GTCCGCGGCT TTACCCAGGA CGATGCGCAC 
ATCTTCTGCA CGCCCAGCCA GATTGAAGAC GAAATCAGCG GCTGTATCGA TTTCGCCATC 
TCTGTCCTGC ACACCTACGG CTTCAACGAG TTCAAGGTTG AACTGAGCGA GTGGGATCCG 
AATGATCGCA AGAGCTTCAT CGGAACCGAC GAGCAGTGGA ACCTCGCACA GGGCTCGCTG 
AAGAAGGTGC TCGACGCGCG TGGGATTCCG TATAAGTCCA TGCCAGGCGA AGCGGCATTC 
TACGGGCCGA AGATTGACGT CAAGCTCGTG GACGCCATCG GACGCCTCTG GCAGCTCTCG 
ACGGTGCAGT TCGACTTCAC CTTGCCGCAG CGCTTCGAAC TTGAGTACGT GGGCGAAGAC 
GGCAAGCGCC ATCAGCCGCT CATGGTGCAC CGTGCGCTCT ACGGCTCCAT TGAACGCTTC 
TTCGGCGTGC TCATCGAGCA CTATGCGGGC GCGTTCCCGG TGTGGCTATC ACCAGTGCAG 
ACGGTGCTGG TGCCCATCGG CGAAAAGCAC CTTGAGTATG CCAACAAGGT TGGAGACGTG 
CTTAAGGCCA AGGGCATCCG CGTGGAAGTG GACGGGCGCA ACGAGAAGAT GAACGCGAAG 
ATCCGCGAGC ATGCGTTGCA GAAAGTGCCG TTCATCCTCG TCGTGGGCGA CAAGGAGGCA 
GAGGCCACCT CGGTGAATGT CCGCACCCGC GGCAAAGATA AGACGGAGAC GGTGCCACTC 
GATTCCTTCG TGGAGCGAAT TGAGAAGCTG ATCGCCGAGA AGAAGCCTAC GCTGGATTAG

Protein sequence

MSDQIKVKLP DGSVKEVSKG TTALDIAKGI SPRLADAALA AKVAPLPHNG DQPEARLVDL 
TRPLEEDSEL KLLTDRDPEA LEVYRHSSAH LLAAAVLDLF PETKLGHGPS TENGFFYDFY 
RQTPFTPEDL EKIEKRMQEL VKEDVPYARE FLPREESLER FKTEGDFMKC HFIEQFTKPD 
EKISIYKTGK FLDFCRGPHI PSTGKIKAFK LLNIAGAYWL GDEKNPQLQR IYGTSFFSKK 
DMDEYFAKLE EAKKRDHRVL GKQLDLFSIQ ELAGPGLIFW HPKGGIIRKE MEDWMREEYL 
KRGYSLVVTP HVARTDLWKI SGHTGYYKQN FFTPMELDDA EYMLKPMNCP GHVLIYRDQL 
RSYRDLPMRL GEMGTVYRYE RSGVMHGLLR VRGFTQDDAH IFCTPSQIED EISGCIDFAI 
SVLHTYGFNE FKVELSEWDP NDRKSFIGTD EQWNLAQGSL KKVLDARGIP YKSMPGEAAF 
YGPKIDVKLV DAIGRLWQLS TVQFDFTLPQ RFELEYVGED GKRHQPLMVH RALYGSIERF 
FGVLIEHYAG AFPVWLSPVQ TVLVPIGEKH LEYANKVGDV LKAKGIRVEV DGRNEKMNAK 
IREHALQKVP FILVVGDKEA EATSVNVRTR GKDKTETVPL DSFVERIEKL IAEKKPTLD