Gene Hlac_2219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2219
Symbol	hisS
ID	7401154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2202657
End bp	2203985
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	643709291
Product	histidyl-tRNA synthetase
Protein accession	YP_002566866
Protein GI	222480629
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.911192
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.722289
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGACG GCCTCAAGGG ATTCCGCGAT TTCTACCCCG GCGAGCAGTC GGCCCGCCGC 
GAGGTGACGG ACGCGATCGA GGACGCCGCG AGTCGGTACG GCTTCCGAGA GATCGCCACC 
CCCGCGCTCG AACGGACAGA AATGTACGTC GACAAGTCCG GCGAGGAGAT CGTCGAGGAG 
CTGTACGCCT TCGAGGATAA GGGCGGCCGC GGCGTCTCGA TGACCCCGGA GCTCACGCCG 
ACCGTCGCCC GGATGGTGGT CGCGAAGGGC CAAGAGCTCT CGAAGCCCAT CAAGTGGATG 
TCCACCCGCC CGTTCTGGCG CTACGAACAG GTCCAACAGG GTCGGTTCCG CGAGTTCTAC 
CAGACGAACA TCGACGTGTT CGGCTCGTCG GCGCCCGAGG CCGACGCCGA GGTGCTGGCG 
GTGGCTGCCG ATGCGCTCAC GGATCTGGGG CTCACCAATG ACGACTTCGA GTTCCGCGTC 
TCCCACCGCG ACATCCTCGG TGGGCTGGTT CGGGCGCTCG CGGCCGACCC CGACGCGGTC 
GACACGAAGG CCGCGATCCG CGCGGTCGAC AAGCGCGCGA AGGTCGACGA CGGCGAGTAC 
CTCGGGCTCC TCTCAGATGC CGGGCTGGAC CGCGCGACCG CCCAGGAGTT CGACGACCTC 
ATCTCGGACG TGGAGACCGT CGACGACCTT GACGCGGTCG CCGAGGCCGG CGGCGAGGAT 
GTCGAGGCGG CAGTCGAGAA CCTCCGGAAC GTGCTCGCCG CCGCCGACGA CTTCGGCGCC 
GGAGCGTTCT GTGAGGTCTC GCTGACGACC GCCCGCGGGC TCGACTACTA CACCGGCGTC 
GTCTTCGAAT GCTTCGACTC CACCGGCGAG GTGTCCCGCT CCGTCTTCGG CGGCGGGCGC 
TACGACGACC TCATCGAGAG CTTCGGCGGC CAACCCACCC CCGCGGTCGG GGTCGCGCCC 
GGTCACGCCC CCCTCTCGTT GCTCTGTCAG CGCGCCGGCG TGTGGCCCGA CGAGGAGCTG 
ACGACCGACT ACTACGTGCT CAGCGTGGGC GACACGCGCT CGGAGGCGAC CGCGCTCGCA 
CGCGATCTCC GCGCGCTCGG CGACGACGTG GTCGTCGAAC AGGACGTCTC CGGCCGGTCG 
TTCGGCGCGC AGCTCGGTTA CGCCGACTCG ATCAACGCGG AGACGGTGGT CGTCGTCGGT 
GAGCGCGACT TGGAGAACGG CGAGTACACC GTGAAGGACA TGGCGAGCGG CGACGAGACG 
ACCGTTCCGG TCGAGGAGTT CCCGCCCGAA GGGGGAGAGG AGCTCCCGAC CTACGAGGAC 
TACGAGTAG

Protein sequence

MYDGLKGFRD FYPGEQSARR EVTDAIEDAA SRYGFREIAT PALERTEMYV DKSGEEIVEE 
LYAFEDKGGR GVSMTPELTP TVARMVVAKG QELSKPIKWM STRPFWRYEQ VQQGRFREFY 
QTNIDVFGSS APEADAEVLA VAADALTDLG LTNDDFEFRV SHRDILGGLV RALAADPDAV 
DTKAAIRAVD KRAKVDDGEY LGLLSDAGLD RATAQEFDDL ISDVETVDDL DAVAEAGGED 
VEAAVENLRN VLAAADDFGA GAFCEVSLTT ARGLDYYTGV VFECFDSTGE VSRSVFGGGR 
YDDLIESFGG QPTPAVGVAP GHAPLSLLCQ RAGVWPDEEL TTDYYVLSVG DTRSEATALA 
RDLRALGDDV VVEQDVSGRS FGAQLGYADS INAETVVVVG ERDLENGEYT VKDMASGDET 
TVPVEEFPPE GGEELPTYED YE