Gene Hlac_1052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1052
Symbol
ID	7400124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1046643
End bp	1047659
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	68%
IMG OID	643708120
Product	D-isomer specific 2-hydroxyacid dehydrogenase NAD-binding
Protein accession	YP_002565719
Protein GI	222479482
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCC AACGCGTCGT CTCGACGCGC CCACAGCTCA TGAGCTCACA CCAGACCGCT 
GATCCCGATA TCGTCGTGCT GCGGGAGGGA ACGGAAGGCC TGTCGATGGC GTCGTACGCG 
GACGCGCTCC GCGAGCGACT CCCGGACCAG ACGGTCGCGC TCGCTCGGAC GCCCGCCGAG 
GAGCGCGAAC TCGTACCGAA GGCCCGCGTG GTGACCGGGA TCACGCTCGA CGCCGACCTC 
CTCGATCGCG CCGACCGACT GGAGTTGTTC GCGTGCACCT TCGCCGGCAC TGACCATGTC 
CCGACCGACG CGCTGCGGGA CCACGGCGTC ACCGTGACGA ACGCGGGCGG TATCCACGCT 
CCGGGCATCG CCGAGCAGTC GATCGCCAAC ATGCTCGTGT TCGCACGCAA TCTCCACGAG 
GGATGGCGTC GGAAGTCGAA CAGCGAATGG CGACATTTCC AGTCGCACGA GTTCACCGAC 
AGCACGGTCA CCGTCGTGGG GCTCGGATCG ATCGGACAGG CGGTCGTCCA ACGGCTCGCG 
GGGTTCGAGG TAGCGACGAT CGGGATCCGG TACACCCCTG AGAAGGGCGG CCCCACCGAC 
GAAGTGCTGA GCTTCGACGA CGGCGACGTC CACGACGCGT TCGCCCGGAG CGACTACGTC 
GTGCTCGCGT GTCCGCTTAC CGATCTGACT CGCGGGATGG TCGGCGAGGC CGAGTTGGCG 
ACGCTCCCGC CGAACGCGGT CGTCGTGAAC GCGGCTCGCG GCGGGCTCGT CGACACCGAC 
GCCCTCGTCT CGGCTCTCCA GACCGAGGGC ATCCGCGGGG CCGCGCTCGA CGTGACCGAC 
CCCGAGCCGC TCCCGTCGGA CCACGTGCTC TGGGACGTAG AAAACTGCCT CATCACCCCG 
CACACGGGCG GCCATACCCC CAAACACTGG GACCGGCTGG CCGACATCGT CGCGACCAAC 
GTCGCGGCGC TCGACGCGGG TGACGAGTTA GAAAACGCGG TCGTCACGCC CGAGTGA

Protein sequence

MIRQRVVSTR PQLMSSHQTA DPDIVVLREG TEGLSMASYA DALRERLPDQ TVALARTPAE 
ERELVPKARV VTGITLDADL LDRADRLELF ACTFAGTDHV PTDALRDHGV TVTNAGGIHA 
PGIAEQSIAN MLVFARNLHE GWRRKSNSEW RHFQSHEFTD STVTVVGLGS IGQAVVQRLA 
GFEVATIGIR YTPEKGGPTD EVLSFDDGDV HDAFARSDYV VLACPLTDLT RGMVGEAELA 
TLPPNAVVVN AARGGLVDTD ALVSALQTEG IRGAALDVTD PEPLPSDHVL WDVENCLITP 
HTGGHTPKHW DRLADIVATN VAALDAGDEL ENAVVTPE