Gene Pars_0658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0658
Symbol	hisS
ID	5056360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	586036
End bp	587295
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	55%
IMG OID	640468218
Product	histidyl-tRNA synthetase
Protein accession	YP_001152901
Protein GI	145590899
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGC TTCCCGACCA GCTGAGGAGG CCTGTAAGGG GCATGCGAGA CTGGATGCCG 
CAACAACTCT ACGCACTGAG GCGTATGGAG GAGGTCTTAT CGTCTGTAGC CGAGCAGTAC 
GGCTATAGAA GGGTCGAGAC GCCTGTAGTA GAACACTTCG AAGTTCTTGC AAAAAAGGCT 
GGGCAGGAGG TTATTAACGA AATCTACTAC TTTAGGGACA AGGCGGGGCG GGAGCTGGGG 
CTTAGATTCG ACATGACTGT GCCCATCGCC AGGGTCTTAT CCTACAACCT TGACCTCCCG 
AGGCCAGTGC GGTGGTACTA CTTCAGCAAG GTTTTTAGAT ACGACGAGCC GCAACACGGG 
AGGTACCGGG AGTTTTTCCA ATTCGGCGTA GAGCTAATCG GCTCAGCCTC ACCGAGGGCA 
GACGCCGAGG TGGTCCAGCT CCTCGCGGCG TCGCTTGAGG CGGCTGGAGC GTCAAAATAT 
GTCATAAGGA TAAACGATAG GAGGGCTGTT GACAAGTTGC TTGAGTCCCT AGGCGCGTTG 
TCCCACAGAG ATGCTGTGTA CAGGGCGCTT GACAAGAAGC TAAAATTGCC CCGGGAGGAA 
GTAATTGGGA TCATGACATC CGGCGGCCTG CCGAGAGATG CCGCGGAAAA GATCTACGAC 
ACGGCCAGCG AGATGAGCTT AGACGAGGCC GTAGAGGTCC TAAGGAGGCT GGACGGAAGG 
CTCGGCGAGG CCTACGCCAA GTTCGTAAAA TACCTCGAAG CCGCGGTGCC CCTGGAGAGG 
TTTAAATTCG ATATGTCTAT TGTCAGAGGA CTCGACTACT ACACCGGCGT GGTTTTCGAG 
GCCTTTGTGG GGGACTACTG GCTCGCCGTG GGCGGAGGCG GCCGCTACGA CGACTTGCTG 
GAGCTGTACA GCGGAGTCAA AATCCCCGCC CTCGGCTTCG CCATAGGCGT AGAGAGGCTT 
ATGGAAGCCG TCGGCTTGCA AAGCGTGGAG AAGCCCCTCG ACTACTACAT ATACATCTTC 
GACGATGACG CGTACAAACA CGCCGTGGCC CTAGCCAATA GGCTACGCAA ACAGGGACAC 
AGCGTAGTGG TTGAGTTAGG AGAAAAGAAC TTAAAGGACG TTTTTGAGTA CGTGTTGAAA 
ATTGGTACCA GATACCTGGT ATTGATAGGC CGTAAGGAGC TTGAAAAAGG AGTGGTGAAG 
ATAAGAGATT TGCAAAAAAG AGGGGAGGTC GAGGTGCCTC TCTCGGCTCT ACTATCTTAG

Protein sequence

MTGLPDQLRR PVRGMRDWMP QQLYALRRME EVLSSVAEQY GYRRVETPVV EHFEVLAKKA 
GQEVINEIYY FRDKAGRELG LRFDMTVPIA RVLSYNLDLP RPVRWYYFSK VFRYDEPQHG 
RYREFFQFGV ELIGSASPRA DAEVVQLLAA SLEAAGASKY VIRINDRRAV DKLLESLGAL 
SHRDAVYRAL DKKLKLPREE VIGIMTSGGL PRDAAEKIYD TASEMSLDEA VEVLRRLDGR 
LGEAYAKFVK YLEAAVPLER FKFDMSIVRG LDYYTGVVFE AFVGDYWLAV GGGGRYDDLL 
ELYSGVKIPA LGFAIGVERL MEAVGLQSVE KPLDYYIYIF DDDAYKHAVA LANRLRKQGH 
SVVVELGEKN LKDVFEYVLK IGTRYLVLIG RKELEKGVVK IRDLQKRGEV EVPLSALLS