Gene Hlac_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2551
Symbol
ID	7399776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2527223
End bp	2528521
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	69%
IMG OID	643709623
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_002567193
Protein GI	222480956
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGTG GGTTCAACAC CCGGAGTCTC CACGCCGGCG CCGAGGCCGA CCCGGCGACC 
GGGTCGCGCG CGACCCCGAT CCACCAGACG ACCTCGTTCG TCTTCGACGA CGCGGAGACG 
GCGGCGGAGA TGTACGCGCT CCGGGCGGAG GGCCACATCT ACTCCCGGCT CTCCAACCCG 
ACCGTGAGCG TCCTCGAAGA CCGGATCGCC GACCTGTCGG GCGGCTCCGA CGCGGTCGCG 
ACCGGCTCGG GGATGGCCGC GTTCGACGCG ATAACGACCG TGCTCGCGAG CGCGGGCGAC 
AACGTCGTCG CCAGTTCCGA GATGTACGGC GGCACGGCCG CGTACCTCAC CAGCATCGCG 
AACCGCCGCG GAGTCGAGGC CCGACTCGTC GACACGCTCG ACGACGAGGC GTACGCGGAC 
GCGATCGACG ACGACACCGC GTTCGTCCAC GTCGAAACGG TCGCGAACCC TTCGCTCGTC 
ACGCCCGACT TCGAGCGGCT CGCGGAGATC GCCCACGAGA ATGCGGTCCC GCTCGTGGTC 
GACAACACGT TCGCGACCCC CTACCTCTGT CGGCCGTTCG AGCACGGCGC CGACATCGTT 
TGGGAGTCGA CGACGAAGTG GATCACGGGC AACGGGACGA CCGTCGGCGG CATCGTCGTC 
GACGGCGGCC AGTTCCCGTG GGACCACCCC GACGCCGACT ACGACGAACT CGACGGGCAG 
TCCCCCGCCT ACCCGATCGA CTTCGTCGAG CGGTTCGGCG ACGCCGCCTT CGGCAACGTC 
GCCCGGCAGC GCGGGGTGCG GCCGACCGGC GGCCAGCAGT CGCCGTTCGA CGCGTGGCAG 
ACGATTCAGG GGCTCAACAC GCTCCCGCTC CGGATGGAGC GCCACTGCGA GAACGCCCGG 
ACCGTCGCCG AGTTCCTCCA AGACGACGAC CGGGTCGATT GGGTGACGTA CCCCGGCTTC 
GAGGACCACC AGAGCCACGA CAACGCCGCC AAATACCTCG ACGGCTACGG CGGGATGGTC 
ACCTTCGGCG TCGACGGCGG CTACGAGGCC GCCAAGACCT TCTGCGAGGC CGTCGACCTG 
ACGAGCTTCC TCGCGAACAT CGGGGACGCG AAGACGCTGG TCATCCACCC GGCCTCGACC 
ACGCATGCGC AGATGGACGA AACGCAACAG CGGCTCGCCG GGGTCTACCC GGAGATGCTC 
CGGCTCTCCG TCGGAATCGA GGACGCAGAC GACGTGATCG CCGACCTCGA TCAGGGGCTC 
ACCGCCGGCG AACGCGCCGC GACCGACACG GAGGTGTGA

Protein sequence

MTRGFNTRSL HAGAEADPAT GSRATPIHQT TSFVFDDAET AAEMYALRAE GHIYSRLSNP 
TVSVLEDRIA DLSGGSDAVA TGSGMAAFDA ITTVLASAGD NVVASSEMYG GTAAYLTSIA 
NRRGVEARLV DTLDDEAYAD AIDDDTAFVH VETVANPSLV TPDFERLAEI AHENAVPLVV 
DNTFATPYLC RPFEHGADIV WESTTKWITG NGTTVGGIVV DGGQFPWDHP DADYDELDGQ 
SPAYPIDFVE RFGDAAFGNV ARQRGVRPTG GQQSPFDAWQ TIQGLNTLPL RMERHCENAR 
TVAEFLQDDD RVDWVTYPGF EDHQSHDNAA KYLDGYGGMV TFGVDGGYEA AKTFCEAVDL 
TSFLANIGDA KTLVIHPAST THAQMDETQQ RLAGVYPEML RLSVGIEDAD DVIADLDQGL 
TAGERAATDT EV