Gene Hlac_0797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0797
Symbol
ID	7400762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	799084
End bp	800154
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	67%
IMG OID	643707862
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002565466
Protein GI	222479229
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCGA TCGCCGTGTA CGACGGGGCA GACGAACCGG TCGTCACAGA GAAGCCGCGA 
CCGGAGCCAG CGCCCGGGGA GGCGCTGGTT CGAACCCTCC GGGTCGGCGT CGACGGGACC 
GACCACGAGG TCATCTCCGG GAGCCACGGC GGCTCTCCCG AAGGCGAGGA TCACCTCGTG 
TTGGGTCACG AGGCAGTCGG CGTGGTTGAA GAGCCGACCG ACACGCCGTT CGAGGTCGGA 
GATATTGTGG TACCGACGGT CAGGCGACCG CCCAACGGGG CGAACGAGTA CTTCGCTCGC 
GGCGAGCCAG ACATGGCGCC GGACGGGCAG TACCACGAGC GCGGCATCGT CGGGGCCCAC 
GGATTCATGG CGGAGTACTT CACCAGTCCC GCGGAATTCC TCGTCGAGAT CCCGCCGGCG 
CTGGCTGAGT GGGGGTTCCT CGTCGAACCC GTCTCTATCG CGGAGAAGGC GATCGAACAC 
GCCTACGCCA GCCGGTCCGC GTTCCACTGG GAGCCGGAGT CGGCGTTGAT TCTCGGAAAC 
GGCTCGCTCG GGCTGCTGAC GGTCGCGACT CTCGACGACG GGTTTGACCG GATCTACTGT 
CTCGGCCGCC GCGAGCGCCC GGACCCGACG ATCGATATCA TCGAGTCGCT CGACGCGACG 
TACGTCAACT CCAACGAGAC GCCCGTCCCC TCGGTGCCGG CGGCCCACGA GCCGATGGAC 
TTCGTCTTCG AGGCGACCGG CTACGCCCCG CACGCCTTCG AGACGATCGA GGCGCTCGCG 
CCGAACGGGG TGGGCGCGCT GCTCGGGGTC CCGGGCGACT GGGAGTTCGA GATCGACGGC 
GGCCGACTCC ACCGGGAGTT CGTCCTTCAC AACAAGGCGC TCGTCGGCAG CGTCAACTCC 
GGCTACGAGC ACTTCGAGGC CGCCGTCGAC TCGCTGTCCC GCTTTTCCGA GACGTTCCTC 
GACGATCTCG TCACGGGCGT GCACGGGCTC GACGAGTTCG AGGCCGCGTT CGCGGATGAC 
GACACGACTA TTAAAACGGC GGTCGAATTC GGTACATATG AAGAACGTTG A

Protein sequence

MNAIAVYDGA DEPVVTEKPR PEPAPGEALV RTLRVGVDGT DHEVISGSHG GSPEGEDHLV 
LGHEAVGVVE EPTDTPFEVG DIVVPTVRRP PNGANEYFAR GEPDMAPDGQ YHERGIVGAH 
GFMAEYFTSP AEFLVEIPPA LAEWGFLVEP VSIAEKAIEH AYASRSAFHW EPESALILGN 
GSLGLLTVAT LDDGFDRIYC LGRRERPDPT IDIIESLDAT YVNSNETPVP SVPAAHEPMD 
FVFEATGYAP HAFETIEALA PNGVGALLGV PGDWEFEIDG GRLHREFVLH NKALVGSVNS 
GYEHFEAAVD SLSRFSETFL DDLVTGVHGL DEFEAAFADD DTTIKTAVEF GTYEER