Gene Hmuk_1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1302
Symbol	hisS
ID	8410822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1232611
End bp	1233921
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	67%
IMG OID	645019633
Product	histidyl-tRNA synthetase
Protein accession	YP_003177130
Protein GI	257387357
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.194766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGACT CGCTGAAGGG GTTTCGAGAT GTCTACCCCG CCGAGATGGC CGCTTACCGC 
CAGGTCATCG ACGAGATCGA GACGACGGCC CGCCAGTACG GTTTCCGTGA GATCACGACG 
CCGGCACTGG AAGCCACGGA GATGTACGTC GACAAGAGCG GCGAGGAGAT CGTCGAAGAG 
CTGTACCACT TCGAGGACAA GGGCGGGCGC GACGTTGCGC TGACGCCGGA GCTGACTCCC 
ACGGTGGCCC GGATGGTCGT CGCCAAGCAA CAGGAGCTCT CGAAGCCGAT CAAGTGGGTC 
TCCACGCGCC CGTTCTGGCG CTACGAGCAG GTCCAGCAGG GCCGATTCCG CGAGTTCCAC 
CAGACGAACA TCGACATCTT CGGGTCGAGC GAGCCGACGG CCGACGCCGA GATCCTGGCG 
GTCGCGACCG ACATGCTGAC GGGACTGGGC CTCAGCGCCG ACGACTTCGA CTTCCGGGTC 
TCACACCGTG ACATCCTCAC GGGACTGCTC GAATCCTTCG AGGCCGACGT GGACACCCAG 
GACGCGATTC GCGTCGTCGA CAAGCGGGCG AAGATCGACC GCGACGAGTA CGTCGAGGGG 
CTCACCGATG CGGGCCTCTC CCTCGACCAG GCCGAGCAGT TCGACGAGTG GCTCCGGGCC 
GGCGACGACG ATCTGGACGC GCTCGCGGAG ATGAGCGGCT CCGAGCAGGT CGCAGACGCC 
GTCGCGAACC TCGAAGCCGT CCTCGCGGCC GCGGAGGACT TCGGCGTCCG GGAGTACTGC 
ACGATCTCGC TGACCACCGC CCGCGGGTTC GACTACTACA CCGGCGTCGT CTTCGAGTGT 
TTCGACTCGA CCGGCGAGGT CTCCCGGGCG GTCTTCGGTG GCGGTCGGTA CGACGACCTG 
ATCGAGGGCT TCGGCGGCGA GCCGACGCCA GCGGTGGGCT TCGCGCCGGG CGTCATGAAC 
TCGACGCTCC CCCTCTTGCT CCAGCGAGCG GGCGTCTGGC CCGAGGAGGC GGTGTCGACG 
GACTACTACG TCCTGCAGGT CGGTGACACT CGCCCCGTCG CGGCCCGCAT CGCGCGGGAA 
CTCCGCGAGT CGGGCCACGT CGTCGAGGCC GACGTGTCCG ACCGGAGCTT CGGGGCGCAG 
ATGGGCTACG CGGACTCGAT CAACGCCGAG ACGGTCGTCA TCGTCGGCGA GAACGACCTC 
GAAAACGACG AGGTCACGGT CAAGGACATG GCCAGCGGCG AGCAGACGAC CGCGCCCGTC 
GACGCATTCC CCGGCGATCA CGAGCGCCCG ACCTACGGCG ACTTCGCGTA A

Protein sequence

MYDSLKGFRD VYPAEMAAYR QVIDEIETTA RQYGFREITT PALEATEMYV DKSGEEIVEE 
LYHFEDKGGR DVALTPELTP TVARMVVAKQ QELSKPIKWV STRPFWRYEQ VQQGRFREFH 
QTNIDIFGSS EPTADAEILA VATDMLTGLG LSADDFDFRV SHRDILTGLL ESFEADVDTQ 
DAIRVVDKRA KIDRDEYVEG LTDAGLSLDQ AEQFDEWLRA GDDDLDALAE MSGSEQVADA 
VANLEAVLAA AEDFGVREYC TISLTTARGF DYYTGVVFEC FDSTGEVSRA VFGGGRYDDL 
IEGFGGEPTP AVGFAPGVMN STLPLLLQRA GVWPEEAVST DYYVLQVGDT RPVAARIARE 
LRESGHVVEA DVSDRSFGAQ MGYADSINAE TVVIVGENDL ENDEVTVKDM ASGEQTTAPV 
DAFPGDHERP TYGDFA