Gene Hlac_0522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0522
Symbol
ID	7400403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	543071
End bp	544087
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	71%
IMG OID	643707587
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_002565194
Protein GI	222478957
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0876145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.61344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA CCGCGCTCTA CTTTACGGCC CCGGAGACCG TCGAGGTGCG GGAGACGGCG 
GTCGGCCCGC CGGCCGCAGA CGAACTCCTC GTCGACACCC GCGCGTCGGC GATAAGCGCC 
GGGACGGAAC TGCTCGTGTA TCGCGACCAG ACGCCGGCCG ACCTCCCGGC CGACGAGACC 
CTTGATGCGC TCGACGGGGA TCTGTCGTAC CCGCTCCGGT ACGGCTACGC CGCGAGCGGC 
GTTGTCCGCG AGGTCGGTAG CGACGTCGAT CCGAACTGGG TCGGCCGGTC AGTGTTCTCG 
TTCGTCCCGC ACCAAACGAG CTTCTGCGCG ACCCCCGACT CGGTGGTCGC ACTCCCGCCG 
GAGACGACGC CGGCCGCCGG GTCGTTGCTC CCGTCGGTCG AGACCGCGAC GAACATCGTC 
CTCGACGCCG CCCCTCGGCT CGGAGAGCGA GTCGTGGTGT TCGGTGCCGG GGTGATCGGG 
CTCTGCGTCA CCCGACTGCT GGCCGCGTTT CCGCTGGAGT CGCTCGTCGT GGTCGACCCG 
ATCGAGCGCC GCCGGGCGCT CGCCGCGGAG TTCGGCGCTG ACCGAACGAC GACGCCGACC 
GAGCTCGGTG ACGCCGATCC CGCCGGCGCG GACCTCGCCG TCGACGGCGC CGATCTCGCG 
ATCGAGCTGT CCGGCCAGCC GAGCGCGCTG GACGATGCGA TCGGGGTCGT CGGCTACGAC 
GCGCGGATCG TCGTCGGCTC GTGGTACGGG ACCAAACGCG AGCCGATCGA TCTGGGCGGG 
CGATTCCACC GGAACCGCAT CGACATCGTC TCCAGTCAGG TGTCGACGAT CAGCCCGGAA 
CTGCGCGGCC GCTGGGACCG CGACCGGCGC ATGGACGCGG CGCTCGATCG GCTCGACTGG 
ATCCCCGCCG ACGAGCTGAT CACCCACCGG ATCCCCTTCG AGCGCGCACC GGAGGCGTAC 
GAGCTGCTCG ACTCGGCGCC CGACGACGCG GTACAGGTCA TCTTGGAGTA CGAGTGA

Protein sequence

MTDTALYFTA PETVEVRETA VGPPAADELL VDTRASAISA GTELLVYRDQ TPADLPADET 
LDALDGDLSY PLRYGYAASG VVREVGSDVD PNWVGRSVFS FVPHQTSFCA TPDSVVALPP 
ETTPAAGSLL PSVETATNIV LDAAPRLGER VVVFGAGVIG LCVTRLLAAF PLESLVVVDP 
IERRRALAAE FGADRTTTPT ELGDADPAGA DLAVDGADLA IELSGQPSAL DDAIGVVGYD 
ARIVVGSWYG TKREPIDLGG RFHRNRIDIV SSQVSTISPE LRGRWDRDRR MDAALDRLDW 
IPADELITHR IPFERAPEAY ELLDSAPDDA VQVILEYE