Gene Hlac_0997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0997
Symbol
ID	7401892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	990229
End bp	991440
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	72%
IMG OID	643708063
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_002565664
Protein GI	222479427
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACCGA TCGCAGACTC CTTCGAACAC GACTATCAGG GCTGTGAGAT CCGGTACGGC 
CGCGGGCGCG TCGCCGAACT CGGCGATGCC CTCGACGAAC GGGAACTCGG TGACGCCCTC 
GTCGTCTGCG GCTCGAACGT CGGCGCCAAC GAGGACCTGA TGGACCCGAT ACGCGAAGGG 
CTCGGTGACC GGCTCGCAGG GGTCTTCGAC GGGACGACCC CGGACAAGCG CGTCGAGACG 
GCGTTCGATC TGCTCGATCG ACGGGCCGAG GTCGGCGCAG ACGCTCTCGT CGCGGTCGGC 
GGCGGGAGCA GCCTCGACAT CGCGCGGCAG GCGACGCTCC TCGATGTCGA CGGGCGGGAC 
CTCGCTGACC TTCGCGCGGA CGCTGAGGTC GGGGCGGACG CGCTCGGCGA CCTCGCACCC 
AGGACCGACC CCGCGCTCCC CGTCGTCGTG ATTCCGACGA CGTTCGCGGG CGCAGACGTC 
TCGACAGGCG GCTCACTGGA GGTGCTCGAC GCGGACGCCT CGCCCACCGG CCAGCCGATG 
ACGGTCAGCG GCGGGGGCGC GATGCCCGCG ATCGACCTCG CGGACCCGGC GCTGTTCGAG 
ACGACCCCGC AGTCGGTGCT GGCGGGCTCG GCCATGAACG GATTCAACAA GGGGATCGAG 
ACGCCGTACG CTGCCGACGC TTCGCCCGTG AGCGACGCGA CCGCGGTCCA CGGGACGCGG 
CTCCTGCGGG ACGCGCTCCC GCACGTCGCC GGCGACCGGC CCGACGATCC GGCGGCGACC 
GACCGCGCCG TGGTCGGCGC GCTGCTCGTC CAACTCGGAC GGAAGATCTC GGTGATTCAC 
GCGTTCGGCC ACGGCTTCGC GCGTCGGTAC GACGTACAGC AGGGGACCGT CCACGCGGTG 
GTCGCGCCGC ACGTCCTCGC GTACCTCTTC GACGAGGTGG ACGCGAGCCG GCGGGCGCTC 
GCGAACGGGC TCGGCGTCGC GACCGCGGGC CGCGACGACG CCGCGATCGC CGAGGACGTG 
GTTAGCGAGG TCGCCGCGGT CCGCGACTCC CTCCCGGTCC CCTCGCGGCT CCGCGAGCTG 
GACCCGGTCG ACGAAGACGA TTTCCCCGCG ATCGCCGAGT ACATCGCCGA CGACTGGTCG 
ATGGAACAGG CCCCCGCCGA CCTCGACGCG ACGCCCGAAG CGATCGAGGG TGTGCTACGC 
GAGGCGTGGT GA

Protein sequence

MLPIADSFEH DYQGCEIRYG RGRVAELGDA LDERELGDAL VVCGSNVGAN EDLMDPIREG 
LGDRLAGVFD GTTPDKRVET AFDLLDRRAE VGADALVAVG GGSSLDIARQ ATLLDVDGRD 
LADLRADAEV GADALGDLAP RTDPALPVVV IPTTFAGADV STGGSLEVLD ADASPTGQPM 
TVSGGGAMPA IDLADPALFE TTPQSVLAGS AMNGFNKGIE TPYAADASPV SDATAVHGTR 
LLRDALPHVA GDRPDDPAAT DRAVVGALLV QLGRKISVIH AFGHGFARRY DVQQGTVHAV 
VAPHVLAYLF DEVDASRRAL ANGLGVATAG RDDAAIAEDV VSEVAAVRDS LPVPSRLREL 
DPVDEDDFPA IAEYIADDWS MEQAPADLDA TPEAIEGVLR EAW