Gene Acid345_2032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2032
Symbol
ID	4073201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2434202
End bp	2436145
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	59%
IMG OID	637984046
Product	arginyl-tRNA synthetase
Protein accession	YP_591107
Protein GI	94969059
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATCGGT CTCTCCAGCA GCGCCTCATC TCCGCCATCC AGGCCTTCCT CCGCCAGAAA 
TACGACGTCC ATCTTCCCAC CCTCGTGGTG GACGCTCCAC CCAAGGTCGA GATGGGTGAA 
TACGCTCTTC CGTTCTCGTT CGAACTCGCC AAGCGCCTGC GCAAAGCCCC GCGCAAAATA 
GCCGAAGAAG TCGCAACCGA ACTGCCGCCC ATCGAAGGCT TCGAGAAGCC TGAGGTCGCA 
GGCGCCGGGT ACATTAACTT CCGCCTGAAG CGGGGGGATG CAGCCACCGC GTTAGCAAAA 
GGAGAATCCA CGCCGGTCAC CCACGACGGC AAGATTCTGG TCGAGCACAC CTCGATCAAT 
CCCAACAAGG CCGCGCACAT CGGCCACCTG CGCAACTCCA TCCTTGGCGA CACCTTCGTC 
CGCCTTTTGC GCGCCGCCGG CCGCACCGTC GACATCCAGA ATTACATCGA CAACACTGGC 
GTTCAAGTCG CCGACGTCGT CGTCGGCTTC ACCCATATCG AGAACAAGTC GAAGGCCGAA 
ATCACTGCGC TCACCGAGCA GCCCAAGTTC GACTACTACT GCTGGGACCT CTACGCCCAC 
ACCTCGCAGT GGTACGAGCA GGCCGCGGAG AACAAGAAGA TCCGCCTCGA AGTCCTGCAC 
GCCATCGAGC ACGGGGGCAA CGAGCTCTCC GAGATCGCTG AAATCATCTC GCGCGCTGTC 
CTCCGTCGCC ATCTCGAGAC CATGGACCGC CTCGGCATTG AATACGATTT CCTGCCGCGC 
GAGAGTGAAA TCCTCCGCCT CAACTTCTGG GCACTCGCCT TCGAGCAGCT CAAAGAAAAA 
GGTGTCCTCT ACTTCGAAAC CGAAGGTAAG AACAAGGGCT GTTGGGTCAT GACCCGGCCA 
GGCCGCGAAC GGGTCGATGG CCAGCCGGAC GAGGACGCTA AGGTCATTGT CCGTTCGAAC 
GGGACAGTCG GCTACGTCGG AAAGGACATC GCCTACCATC TTTGGAAGTT CGGCCTGCTC 
GGCCGCGACT TCGGCTACAA AAAGTTCTAC CTCTATCCCA ACGGCCAGCA GGTCTGGATC 
AGTTGTGATC CCGCCGAGGG GGAGAGCGAC CACCCCCATT TCGGTGGCGT CAGCGAAATT 
TACAACGTCA TCGATACCCG CCAGTCCGAT CCTCAGGAGA CGGTCAAGGA AGCCATCCGA 
CTCCTCGGCT ACAACGACAA AGCCGACCAC TACACCCACT TCTCCTACGA GATGGTCGCG 
CTCACCCCGC GTTGCGCCAT CGATCTCGGC TACGACGTCT CGGAAGATGA TCGTGCCAAG 
TCCTATATAG AAGTCAGTGG CCGCAAAGGT TTCGGAGTCA AAGCCGACGA CCTCATCGAC 
AAGCTCATCG ACGCCGCGAC CAAAGAAGTC GATTCCCGCC ACCCGGAACT CACCGAGTCC 
GAGCGCCGCG AAATTGGCAC CCAAATCGCC ATCGGCGCCC TGCGCTACTT CATGCTCAAG 
TACACCAAAG CATCGGTCAT CGCCTTCGAC TTCAAGGAAG CTCTCGCCTT TGAAGGCGAA 
ACCGGTCCCT ACGCGCAGTA CGCGGTGGTC CGCGCCACCA ATATTTTTCG CAAAGCCGGC 
ATCGCACCCG GAGATGCACT CGCGTACAAC GTCGATTTCA CGAAGCACTT TGCCGAGACT 
GCCGAGATAT GGGAAGTCTG GCTCATGGCA GGGAAGACCT CACAGATTCT CGAGCTCTGC 
ATCTCGCAAT CCGAGCCCGC CTACGCCGCC AAGCACGCTT TCCAACTTGC GCAACTGTTC 
AACAACTTCT ACCACCGCCA CCACATCCTC ACCGAGGAAG ACGAAGGCCG GAAGAAATTC 
CTGCTCGCCA CCGCCGCCGT CATGCGCCGC GAACTAATTG CCGTCCTCGC TGCCATGGGC 
ATCAGCGTTC CGCCTGTCAT GTAA

Protein sequence

MYRSLQQRLI SAIQAFLRQK YDVHLPTLVV DAPPKVEMGE YALPFSFELA KRLRKAPRKI 
AEEVATELPP IEGFEKPEVA GAGYINFRLK RGDAATALAK GESTPVTHDG KILVEHTSIN 
PNKAAHIGHL RNSILGDTFV RLLRAAGRTV DIQNYIDNTG VQVADVVVGF THIENKSKAE 
ITALTEQPKF DYYCWDLYAH TSQWYEQAAE NKKIRLEVLH AIEHGGNELS EIAEIISRAV 
LRRHLETMDR LGIEYDFLPR ESEILRLNFW ALAFEQLKEK GVLYFETEGK NKGCWVMTRP 
GRERVDGQPD EDAKVIVRSN GTVGYVGKDI AYHLWKFGLL GRDFGYKKFY LYPNGQQVWI 
SCDPAEGESD HPHFGGVSEI YNVIDTRQSD PQETVKEAIR LLGYNDKADH YTHFSYEMVA 
LTPRCAIDLG YDVSEDDRAK SYIEVSGRKG FGVKADDLID KLIDAATKEV DSRHPELTES 
ERREIGTQIA IGALRYFMLK YTKASVIAFD FKEALAFEGE TGPYAQYAVV RATNIFRKAG 
IAPGDALAYN VDFTKHFAET AEIWEVWLMA GKTSQILELC ISQSEPAYAA KHAFQLAQLF 
NNFYHRHHIL TEEDEGRKKF LLATAAVMRR ELIAVLAAMG ISVPPVM