Gene Hore_19570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19570
Symbol
ID	7312772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2101720
End bp	2102913
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	48%
IMG OID	643612403
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_002509699
Protein GI	220932791
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase [TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAA AGACAAAAAA GCAGTATGGA TTTAATACCC TGGCTTTACA CCATGGTTAT 
GACCCGGTCC AGGAAGGGAG CAAATCCAGG GCAGTTCCCA TTTACCAGAC AACATCCTAT 
ATGTTTGATA GTGCTGAACA TGCTGCTGGC CTGTTTGCCG AAGAAGAAGA AGGGTATATT 
TATACCAGAA TTGGGAACCC GACAACTAAA GTTTTTGAAG AAAGGATGGC CGTCCTCGAG 
GGAGGGGAGG CCGGGCTGGC AACCTCATCG GGGCAGTCTG CTATTACCCT GACTATACTG 
ACATTGGTCA GCCAGGGGGA AGAGGTGGTA TCATCAAGCT ATATTTACGG AGGGACCTAT 
CATCTTCTGG CTGAGAGTCT CCCCCGGTAT GGGGTTAAGA CCAGATTTGT CAAACCTGAT 
GATATAAATG ACTGGGAGCA GGCTATAACA GATAAAACCC GGGTTTTTTA CCTGGAATCA 
CCGGGCAATC CCCGGCTTAA TATTGTTGAT ATTGAGGCTG TATCCAGCCT GGCCCATCAA 
TACGGTATAA CTGTAGTTGT TGATAATACC TTTAATACTC CCTATTTAAG CCAGCCCCTT 
AAATTGGGGG CTGACATTGT AGTCCATTCT ACTACCAAGT ATATCGGGGG TCATGGTAAT 
TCAATTGGGG GGGTTATTGT TGGAACCCGT GATTTTATCC ATAAAGTCCG GACTGAGCTT 
TACCGTGATA CTGGTCCTGC CATAAGCCCC TTTAATGCCT GGCTTTTCAT CCAGGGGTTA 
GAGACCCTTT CATTGAGAAT GGAAAAACAC TGTAGTAATG CCATGGAGGT TGCCCGGTGG 
CTCTCCGGAG ATGAAAGGGT TGAATGGGTG ACTTACCCTG GCCTTCCTGA CCATCCCCGG 
CATGAACTGG CCAAAAAGCA GCAGCGGGGG TTTGGTGGAA TGATTTGTTT CGGGGTTAAA 
GGTGGTTATT CAGCGGCCCG GAACCTTATC AACAGGGTGG AACTGTGTTC TCTACTTGCC 
AATATAGGTG ATACCCGCAC CCTTATTATT CACCCTGCCT CTACCACCCA TGAGCAGTTG 
AGTAGAGAGG AGCAGGAAAA GGCAGGGGTT ACCCCTGATT TAATCAGACT ATCGGTAGGA 
ATAGAGGATG TATGGGATAT AATTGATGAC CTGGATCAGG CCCTGGGGGG GTAG

Protein sequence

MNKKTKKQYG FNTLALHHGY DPVQEGSKSR AVPIYQTTSY MFDSAEHAAG LFAEEEEGYI 
YTRIGNPTTK VFEERMAVLE GGEAGLATSS GQSAITLTIL TLVSQGEEVV SSSYIYGGTY 
HLLAESLPRY GVKTRFVKPD DINDWEQAIT DKTRVFYLES PGNPRLNIVD IEAVSSLAHQ 
YGITVVVDNT FNTPYLSQPL KLGADIVVHS TTKYIGGHGN SIGGVIVGTR DFIHKVRTEL 
YRDTGPAISP FNAWLFIQGL ETLSLRMEKH CSNAMEVARW LSGDERVEWV TYPGLPDHPR 
HELAKKQQRG FGGMICFGVK GGYSAARNLI NRVELCSLLA NIGDTRTLII HPASTTHEQL 
SREEQEKAGV TPDLIRLSVG IEDVWDIIDD LDQALGG