Gene Hlac_3373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3373
Symbol
ID	7402226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	+
Start bp	126560
End bp	128158
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	64%
IMG OID	643709922
Product	Aldehyde Dehydrogenase
Protein accession	YP_002567488
Protein GI	222481252
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTCA GTCAATTCGA GAACGAACTT ACGATTCACG AGCACACGCA GGCGGGGACG 
CTGGACGAGT TTCACCGTGC CTACGAGGCC GAAGTCGACG ACATCCGCTC CGATTTCGGG 
GCGACTCACC CTCTCCGGAT CGACGGCGAC GCGGTCGAGA CCGGAGAGAC ATTCACCGTC 
ACGAATCCGG GAGACACGGA CCAGGTCCTC GGGGAGTTCG CAGCGGGAGA TGAGACGCAC 
GTCGACGAGG CCGTCGCGGC CGCGAGCGAC GCCTTCGACG AGTGGAAGGA GACGTCCTGG 
GAGGAGCGCG TCGCGATATT TCGCGACGCC GCGGACGTCA TCCAGGACCG CAAACTCGAG 
ATCACAGCGT TGATGGCCTA CGAAAATGCA AAAACACGGA ACGAGGCGAT TGCGGAGGTC 
GACGAGGCGA TCGACTTCCT CCGGTACTAC AGCAGTGAAC TGGAACGGAA CGAGGGATAC 
ACCGCCGACA CACATGAGCC AACACCTGGC CAGCGCTGCG TCAGCGACCT CCAGCCGTAC 
GGCGTCTTCG GCGTTGTGGC CCCGTTCAAT TTTCCGTTCG CGATCACCGT CGGAATGACA 
ACCGGCGCGC TGATCACCGG AAACACCGCA GTCGTGAAGC CGGCGAGCAC CACGCCGCTG 
ACGGCGCACG CGTTCTACGA CGCCCTCGCG GAGGCGGGCA TTCCGGACGG CGTCGTCAAC 
CTGGTCACGG GTGGCGGGCG GGCGGTCGGT CAACCGATGA TCGAACACGA GGACGTCGCC 
GGATTCGTGT TTACGGGCTC TCGCGAGGTC GGACTCGAGA TCCAGCGGAC CTTCGACGAG 
CTGGGCAAAC GCGGGCCAGT CGTCGCGGAG CTCGGCGGGA AGAACCCGGT CATCGTCTCC 
GACAGCGCCG ATGTCTCGAA GGCCGTCTCT GGCGTGAAGT TTGGTGCGTT TTCGTTCAGC 
GGTCAGAAGT GCTCTGCGAC CTCCCGCGTA TACGTCCACG AGGACATCGC CGACGAGTTC 
ACGGAGCAAC TCGTCGAGGA GACGAACGAC CTCTCCATCG GCAAGCCCGA GAACCGGGAG 
ACGGTCGTCT CTCCCCTGAT CGACGACAGC GCGATCGAGC GCTACGACGA TATCTGTGAA 
ACGGCGGCCG CGGACGGCAC GGTCCTGACC GGCGGGAGCC GCATCGACCG AGAAAACCTC 
CCGACCGGCC GGTACGTCGA GCCGACCGTG GTCACGGACA TTCCGCACGA TCACGCGCTC 
GCGACGGACG AGCACTTCCT CCCGTTCGTT ACTATCCACC CCGTCTCGAG CCTCGAGGAA 
GGGATTACGA AGGCCAACGA CAGCGATTAC GGACTCTGTG CTGGCCTCTT CTCCGAGGAC 
GAGGACGAGA TCGACACGTG GTTCGACCGG ATCGAGTCCG GGATGTGCTA CGTGAACCGC 
GAGCAGAGCG CGACGACCGG TGCGCTCGTC GAGGCCCAAC CGTTCGGCGG CTGGAAGTAC 
TCCGGGACGA CCGGGAAATT CGCGGGCGGT CCGTGGTACC TCCAGCAGTT CATGCGTCAG 
CAGAGTCGGA CTGTGGTCGG CGACGTCGGA CAGCCCTGA

Protein sequence

MTLSQFENEL TIHEHTQAGT LDEFHRAYEA EVDDIRSDFG ATHPLRIDGD AVETGETFTV 
TNPGDTDQVL GEFAAGDETH VDEAVAAASD AFDEWKETSW EERVAIFRDA ADVIQDRKLE 
ITALMAYENA KTRNEAIAEV DEAIDFLRYY SSELERNEGY TADTHEPTPG QRCVSDLQPY 
GVFGVVAPFN FPFAITVGMT TGALITGNTA VVKPASTTPL TAHAFYDALA EAGIPDGVVN 
LVTGGGRAVG QPMIEHEDVA GFVFTGSREV GLEIQRTFDE LGKRGPVVAE LGGKNPVIVS 
DSADVSKAVS GVKFGAFSFS GQKCSATSRV YVHEDIADEF TEQLVEETND LSIGKPENRE 
TVVSPLIDDS AIERYDDICE TAAADGTVLT GGSRIDRENL PTGRYVEPTV VTDIPHDHAL 
ATDEHFLPFV TIHPVSSLEE GITKANDSDY GLCAGLFSED EDEIDTWFDR IESGMCYVNR 
EQSATTGALV EAQPFGGWKY SGTTGKFAGG PWYLQQFMRQ QSRTVVGDVG QP