Gene Hlac_0215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0215
Symbol
ID	7402144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	230762
End bp	231802
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	643707278
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002564890
Protein GI	222478653
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0696766
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCTG CCATTTTCAA CGGCCCCGGA GACATCGGCG TCGAAGAGCG TCCGCGCCCC 
GAGATCGAGG CCCCGACCGA CGCGATCGTC CGCGTGACCC ACACCGCGAT CTGCGGCTCG 
GACCTGTGGT TCTACCGCGG CGACAGCGAC CGCGACGAGG GCTCGCCGGT CGGCCACGAG 
CCGATGGGGA TCGTCGAGGA AGTCGGCAAC GAGGTCACCT CGGTCGCGCC CGGAGACCGC 
GTGCTCGCGC CCTTCGCCAT CTCCTGTGGC GAGTGCGAGT TCTGCCGCAA GGGACTCCAT 
ACCTCCTGCG AGAACGGGGA CTCGTGGGGC GGCGACAACG GCGGCGGGCA GGGCGAGTAC 
GTTCGATCGA CTCACGCCGA CGGCACCCTC GTTCGAGTCC CCGATCGGTT TGCCGACGAC 
GAGGAGACGC TCCGGTCACT GCTCCCGCTG ACCGACGTGA TGGGAACCGG TCACCACGCG 
GCCGTCAATG CGGGCGTCGA GGCGGGTTCG ACCGTGGTCG TGATCGGCGA CGGCGCAGTC 
GGCCTCTGCG GCGTGCTCGC GGCCCGCCGA CTCGGCGCCG AGCGGATCAT CGCGGTGGGC 
CACCACGAGG ACCGACTCGA ACTCGCCGAG GAGTTCGGCG CCACGGAGAC CGTCTCGGAG 
CGCGGCGAGG CCGCCGTCGA ACGGATCCAA GAGCTCACCC ACGGCGGGCC GAACCACGTG 
ATGGAGTGCG TCGGCGCCGC AAGCGCGATG AACACCGCCA TCGACGTGGT CCGGCCAGGC 
GGCACGATCG GCTACGTCGG CGTCCCCTAC GGCGTCGAGG AGGAGGGCCT CAACGTGTTC 
GGAATGTTCG GCGACAACGT CACACTTGCA GGCGGCGTCG CGCCCGTCCG CGCGTACGCT 
GAGGAACTGA TGGCGGACGT ACTGCAGGGC ACCCTCGACC CCGCGCCGGT CTTCACCGAG 
ACGGTCGGCC TTGACGAGGT CGACGAGGGG TACCGCATGA TGGACGAGCG CGAGGCGATC 
AAGGTGCTTG TGAAGCTCTG A

Protein sequence

MRAAIFNGPG DIGVEERPRP EIEAPTDAIV RVTHTAICGS DLWFYRGDSD RDEGSPVGHE 
PMGIVEEVGN EVTSVAPGDR VLAPFAISCG ECEFCRKGLH TSCENGDSWG GDNGGGQGEY 
VRSTHADGTL VRVPDRFADD EETLRSLLPL TDVMGTGHHA AVNAGVEAGS TVVVIGDGAV 
GLCGVLAARR LGAERIIAVG HHEDRLELAE EFGATETVSE RGEAAVERIQ ELTHGGPNHV 
MECVGAASAM NTAIDVVRPG GTIGYVGVPY GVEEEGLNVF GMFGDNVTLA GGVAPVRAYA 
EELMADVLQG TLDPAPVFTE TVGLDEVDEG YRMMDEREAI KVLVKL