Gene Hore_12150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_12150
Symbol
ID	7313916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1307761
End bp	1309020
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	39%
IMG OID	643611654
Product	histidyl-tRNA synthetase
Protein accession	YP_002508960
Protein GI	220932052
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00000175223
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGTAA AGGCACCACG GGGGACAAAT GATATTTTGC CCCCCGTTTC TTTAAAATGG 
CAGTATATTG AAGATACAGC AAGACGTATT TTTCAAATGT ATAACTATAA AGAAATTAGG 
ACTCCTATAT TTGAGTATAC AGAGTTATTT CAGCGGGGAA TTGGTGAAAC AACAGATATT 
GTTGAAAAAG AGATGTATAC CTTTGAAGAT AAAGGTGGAC GGAGTATTAC TTTAAGGCCC 
GAAGGAACAG CTTCAGTGGT CAGGGCTTTT TTAGAACATA AAATTTATGG ACAGGTTCAG 
CCTACTAAGT ACTTTTATAT AGGTCCCATG TTCAGGTATG AGAGACCACA GGCCGGTAGA 
TTTAGGCAGT TTCACCAACT GGGGGTTGAA GCCTTTGGTT CCAATGATCC TGCCCTTGAT 
GCTGAAGTTA TTGCCCTGGG ACTCGATATT TTAAAACGGT TAGGCTTAAC AGATGTAGAA 
GTCTTTATCA ATAGTATTGG TTGTCCAGAG TGTCGGGCAA GATATTCAGA TGAACTAAAG 
CAATATTTAG AGTCACATCA GGACAGGCTC TGTAAAGATT GTAAAGCAAG ACTCAATAAA 
AATCCCCTGC GTATCCTGGA TTGTAAAAAT GAAGAATGTT CACTGGTGAT TAAAAATGCC 
CCTAAAATAC TGGATTATTT ATGTGATAAT TGCAGGGTTC ACTTTGAGGA TGTTCAGGAA 
TATCTGGACT TACTGGGTAT TAAATACAGG GTTGATCCAA CCCTGGTCAG GGGACTGGAT 
TACTATACCA ACACTGCCTT TGAAATTAAA TTTAAAGAAC TGGGTGCTCA GGATGCTATT 
TTTGGTGGCG GTCGTTATAA TGGGTTAACA GAAGAAATAG GTAATAAGTC TATTCCGGGA 
ATTGGTTTTG CTGTGGGAAT TGAAAGGCTT ATTCTTGCTC TTGATAAAAA GGGGATAAAG 
TTACCTGTTA ATGACAGTAT TGATGTATAC CTGGTTACAA TTGGTGAACG AGCCAAGCGG 
GCGGCTTTTA ACTATACATA TTTATTAAGA GAATCAGGTA TTACAGCAGA GATAGATTAT 
CTGGGCAGAA GTATTAAAAG CCAGATGAAG TCTGCTGACA GGACAGGTGC CAGTTATACT 
ATTATAATCG GTGATAGTGA ACTGGATTCA GGTAAAGCAA CTGTAAAGAA TATGAGGACC 
GGTGAACAGG TTGAAATTAT GCTTGCCAAT CTTATAGAGG AAATGCAAAA GCTAGTATGA

Protein sequence

MDVKAPRGTN DILPPVSLKW QYIEDTARRI FQMYNYKEIR TPIFEYTELF QRGIGETTDI 
VEKEMYTFED KGGRSITLRP EGTASVVRAF LEHKIYGQVQ PTKYFYIGPM FRYERPQAGR 
FRQFHQLGVE AFGSNDPALD AEVIALGLDI LKRLGLTDVE VFINSIGCPE CRARYSDELK 
QYLESHQDRL CKDCKARLNK NPLRILDCKN EECSLVIKNA PKILDYLCDN CRVHFEDVQE 
YLDLLGIKYR VDPTLVRGLD YYTNTAFEIK FKELGAQDAI FGGGRYNGLT EEIGNKSIPG 
IGFAVGIERL ILALDKKGIK LPVNDSIDVY LVTIGERAKR AAFNYTYLLR ESGITAEIDY 
LGRSIKSQMK SADRTGASYT IIIGDSELDS GKATVKNMRT GEQVEIMLAN LIEEMQKLV