Gene Pars_0707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0707
Symbol
ID	5055266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	629292
End bp	630752
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	61%
IMG OID	640468264
Product	lysyl-tRNA synthetase
Protein accession	YP_001152945
Protein GI	145590943
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1190] Lysyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00499] lysyl-tRNA synthetase, eukaryotic and non-spirochete bacterial

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.282019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAGGC AGAGTGTTGA GAAGGTGGGG GAGTGGAGGC ACCTTTTGGC CTCTCTGCGG 
GGGGCTGGGG TGGAGCCCTA CCCCCACTCC TTTACTGTGG AGCACAGCAT AAAGGCGCTT 
AACGAGCTTA GGCGTCAGGC CCTCCTAGAT CCGTGGCTGG GCGCCACTAT CAGAACCGCG 
GGGAGGGTTA CAGACGTGAG GCGGCACCCC AACGTGGTTT TTATCGACCT CTACGAGGAC 
GGGGCGCGGT TCCAGGTGAT GGCGGATCCG AAGCTCCCGG TTCTTGAGCA CGTATGGCGC 
GGGGACTTTA TCGGAGTGGA GGGGCCTCTT GTGAAGACCC AGCGGGGGGA CTACGCAGTT 
AAGGCCTCCT CAATCGTCCT CTTGGCTAAG GCGGTTCAGC CTCTGCCGGA GTGGGGGAAG 
GTGGACCGAT CCTCCCCGTT CTATATGCGT TACCGCTCGG TGGCGATGGT TCTCGACCTT 
CAGTTGCGGT GGCGGGTGGC GGCCCGGGCG CGGCTGATAC AGGCGTTTAG GGAGGCGATG 
TGGAGGCGGG GGTTTTTGGA GATCCCCACC CCCGTCCTCC AGCCTATATA CGGCGGGGCG 
GCGGCGCGGC CCTTCACGAC TAAGATCTGG GCTATAGACG AGGAGTGGTA TCTCCGCATC 
TCGCCGGAGC TCTACCTCAA GCGGTACATA ATCGCCGGCT TCCCGAAGGT CTTCGAAATT 
GGCCCCCAGT TCCGGAACGA AGATATAGAC GCCCTTCACA ACCCGGAGTT TTGGTCGCTG 
GAGGCCTACC AGGCCTACGC CGACTATAAG GATATTATGA GGCTGACCGA GGAGGTGGTG 
TATGAGGCTG TCAGGGCCGT CTTGGGCACC GGCGTGGTTA AGTACAGGGA GTGGAGCATA 
AACTTCTCGC CTCCGTGGCG GAGGGTTACG CTTCACGACG CGTTGCGGGA GTTCGCCGGG 
GTTGACCCCG ACAGGCTTAC AGACGACGAC ATAAAGGAAA GACTGAGGGA ACTCCAGGTG 
CCGCTTAGGG TGTACAACAG GGGGGTGGCC CTGGTTAAGC TCTTCGAGAA GCTGGTGGAG 
AAGAAGCTGG TGCAACCCAC CTTCGTCTTG GACTACCCCG AGGAGTCCAC CCCCTTGTGT 
AAGCCGCACC GGGAGAAGGC CGGCCTTGTG GAGCGCTTCG AGGCCTTTGT GGGGGGTCTC 
GAAATTGCAA ACGCCTACAC TGAGCTGAAC GACCCGGTGA AGCAGTACGA GTTTTTTGCC 
CGGGAGGAGG AGCTGTTTCC CAAAGACGAG GCGCACCCCT TGGACTGGGA CTTCGTGGAG 
GAGCTGTCCT TTGGCATGCC CCCGACCGGC GGCGTGGGGA TTGGGGTGGA TAGGCTTGCG 
ATGATTATTA CAAACGCCGA GTCTATTAAA GATGTTATCC CGTACCCGAT TGTGTCGCGT 
CGCTCCTTGG CGGAGGGCTA G

Protein sequence

MERQSVEKVG EWRHLLASLR GAGVEPYPHS FTVEHSIKAL NELRRQALLD PWLGATIRTA 
GRVTDVRRHP NVVFIDLYED GARFQVMADP KLPVLEHVWR GDFIGVEGPL VKTQRGDYAV 
KASSIVLLAK AVQPLPEWGK VDRSSPFYMR YRSVAMVLDL QLRWRVAARA RLIQAFREAM 
WRRGFLEIPT PVLQPIYGGA AARPFTTKIW AIDEEWYLRI SPELYLKRYI IAGFPKVFEI 
GPQFRNEDID ALHNPEFWSL EAYQAYADYK DIMRLTEEVV YEAVRAVLGT GVVKYREWSI 
NFSPPWRRVT LHDALREFAG VDPDRLTDDD IKERLRELQV PLRVYNRGVA LVKLFEKLVE 
KKLVQPTFVL DYPEESTPLC KPHREKAGLV ERFEAFVGGL EIANAYTELN DPVKQYEFFA 
REEELFPKDE AHPLDWDFVE ELSFGMPPTG GVGIGVDRLA MIITNAESIK DVIPYPIVSR 
RSLAEG