Gene Hlac_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1850
Symbol
ID	7400042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1854553
End bp	1855695
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	68%
IMG OID	643708919
Product	acetyl-CoA acetyltransferase
Protein accession	YP_002566498
Protein GI	222480261
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0860888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.20671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGACG AGACCACTCC GGTTATCGCC GCAGCCTACC GAACGCCGCA GGGACGCGAC 
GGGGGCGTCT ACGCGGACGT CCGCAGCGAG GATCTTTCGA CGCGCCTCAT CGACCACACG 
CTCGCGGAGA CCGGGCTGAC CGGCGACCAC GTCGACGACC TGATGTGGGG GGTCGCCCAG 
CAGCGGACCG AACAGGACAA CAACGTCGCC CGCGTCATCG CGCTCCTCTC TGACCTCGGT 
GAATCGGTAC CGGCGACCTC GATCAACCGC TGGTGCGCCT CCTCGATGCA GGCGATCATC 
TCGGCAGCGG ACGCCATCGC GGCCGGGAAC CGCGACTGCA TCATCGCCGG CGGCGTCGAG 
AATATGAGTC GCGTCCCGAT GGACGGCGAC TCCTACGAAC ACCTCCACCC CGAGTTGTCG 
GAGCAGTACA ACGTCTTTCA GCTCCAGATG GGAATGACCG CCGAGAAGGT CGCCGAGGAG 
TACGAGGTGA GCCGCGAGGC CCAAGACGAG TACGCCGCCC GGAGCCACCA GCGTGCCGCC 
GAGGCGACGG AGTCGGGACG CTTCGACGAC GAGATCGTCC CCGTGGAGAC CGACGACGGC 
CTGATCGACG AAGACGAAGG GATCCGCCCG GACACGACCG CCGAGAAGCT CTCCGGCCTC 
TCGCCGGCGT TCACGGGGGA CGGCACGGTG ACCGCGGGGA ACTCCTCGCA GATCTCGGAC 
GGCGCGTCGC TGACGCTCGT CACGAGCAAG GCGTTCGCAG AAGACCACGG GCTCGACGTG 
CTCGCGGAGG TCGGCACGAA CAACGTCGCC GGCGTCGACC CCACCGTGAT GGGGATCGGC 
CCGGTGCCCG CGACGCGCGG CCTGCTTGAC CGCGCCGGTC GGACCATCGA CGACTACGAC 
CTCGTCGAGC TCAACGAGGC GTTCGCCTCC CAGTGTGAGT ACTCCCGCCG CGAACTCGGA 
ATCGACGAGG AGCAGTACAA CGTCAACGGC GGCGCCATCG CCATCGGCCA CCCGCTCGGC 
GCCTCCGGCG CGCGACTCCC CGTCACCCTG ATCCACGAGA TGCAGAAGCG CGACGCCGAC 
CGCGGCCTTG CGACCCTCTG TGTCGGCTTC GGACAGGGCG CAGCGATCGA GTTCAGTCGA 
TAA

Protein sequence

MTDETTPVIA AAYRTPQGRD GGVYADVRSE DLSTRLIDHT LAETGLTGDH VDDLMWGVAQ 
QRTEQDNNVA RVIALLSDLG ESVPATSINR WCASSMQAII SAADAIAAGN RDCIIAGGVE 
NMSRVPMDGD SYEHLHPELS EQYNVFQLQM GMTAEKVAEE YEVSREAQDE YAARSHQRAA 
EATESGRFDD EIVPVETDDG LIDEDEGIRP DTTAEKLSGL SPAFTGDGTV TAGNSSQISD 
GASLTLVTSK AFAEDHGLDV LAEVGTNNVA GVDPTVMGIG PVPATRGLLD RAGRTIDDYD 
LVELNEAFAS QCEYSRRELG IDEEQYNVNG GAIAIGHPLG ASGARLPVTL IHEMQKRDAD 
RGLATLCVGF GQGAAIEFSR