Gene Hlac_3047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3047
Symbol
ID	7399021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	-
Start bp	305758
End bp	307284
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	59%
IMG OID	643706854
Product	Aldehyde Dehydrogenase
Protein accession	YP_002564476
Protein GI	222475955
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGTTG ATGACCAATC ACAGACACCA TCGGAGCGTA AATCCGCGAT TAAAAAGCGT 
CACGAGCAGG CCGCAAGCGA GGTGCTACCC GACCATCGAG AACTCTACAT CGGCGGTGAG 
TGGGTCCAGA GTGCCTCCGG CGAGACGTTC ACAACAGTCG ACCCGACAAC CGGTGAGACA 
CTCGCCGAGG TAGAGGCAGG CAACGGCGAG GACATCGACC GCGCGGTCGA CGCGGCCTGG 
GAGGCCTACG ATGAGGTGTA CAGCTCCTAT TCGAGTGCCG AACGACAGGC GATGCTCGAA 
GCGATTGCCG ACCGTATCGA GAACAACGCA GACGAGTTCG CCCGACTGGA GTCCCTCGAC 
AATGGGAAAC CAATTACCGA GGCCCGCATC GATATCGAAC TCGTCGTCGA CCACTTCCGC 
TATTTCGCGG GCATCGCTCG GGCCCACGAG GGACGGACGG TCGACACTGA CGACAGTCGA 
CACGTCCAAA CCATCGAAGA ACCCTACGGC GTCGTCGGCC AAATTATTCC GTGGAATTTC 
CCGCTTTTAA TGGCTGCCTG GAAACTCGGC CCTGCGCTGT CGGCTGGCAA CACAGTCGTC 
CTCAAACCGG CCGAGGAAAC ACCCCTTTCC GTTCTCAAAC TGATGGAGGA GGCCGACGAC 
GTGATCCCAG ACGGTGTCGT CAACATCGTC ACCGGGTTCG GTCCCGATGC TGGCGAACCG 
CTTTCGAACC ACAGCGGCAT CCGGAAACTC GCCTTTACCG GGTCGACCGA AATCGGCAGC 
AAGGTGATGA AAAGCGCCGC CGACAACATC ACCGACATCA CGCTCGAACT GGGTGGCAAA 
AGCCCGCTCG TCGTGTTCCC CGATGCGGAC TTAGAGCAGG CAGTCCAGAC CACGATCACC 
GCCATCTTCT TCAATACCGG CGAGTGCTGC TGTGCGGGTT CACGACTCTT TGTCCACGAA 
GACATCAAAG ATGAGTTCCT CGACGAACTC GCGGCGGCCG CCGAAGATCT GACCGTCGAC 
GATCCACTGC TGGATGCGAC TGATCTCGGC CCGAAGGTGA CCGCTGAACA GGTCGAACGA 
ACCATGAGCT ACATCGAAGA GGCCGAACAG TCCGGGGCGG CCTTTGTCAC CGGCGGCAGC 
CAGCCCGACG ACGAAGCCCT GTCGGACGGC TGTTTCGTTG CGCCAACACT GATCGATAAC 
ATCGATCACG ACAGTAAGGC CGTCCAAGAG GAGATTTTCG GCCCCGTCCA AGAGGTGTTC 
TCGTGGAGCG ACTACGACGA GATGATCGAG TTGGCGAACG ATGTCGACTA CGGGCTCGCA 
GCTGGCGTGA TCACCGAGAA CCTCACGAAG GCCCACCAGT GTGCCAAAGA CATCGAGGCC 
GGCAACATCT GGATCAACAC GTACAACGAC TTCCCAGCTG GCCAGCCGTT CGGCGGCTAC 
AAGCAATCAG GAATCGGCCG TGAAATCGGT CAAGACGCCG TCGACCACTA CACTCAGACC 
AAGACGATCA ACATCAGTCT CAGCTAA

Protein sequence

MSVDDQSQTP SERKSAIKKR HEQAASEVLP DHRELYIGGE WVQSASGETF TTVDPTTGET 
LAEVEAGNGE DIDRAVDAAW EAYDEVYSSY SSAERQAMLE AIADRIENNA DEFARLESLD 
NGKPITEARI DIELVVDHFR YFAGIARAHE GRTVDTDDSR HVQTIEEPYG VVGQIIPWNF 
PLLMAAWKLG PALSAGNTVV LKPAEETPLS VLKLMEEADD VIPDGVVNIV TGFGPDAGEP 
LSNHSGIRKL AFTGSTEIGS KVMKSAADNI TDITLELGGK SPLVVFPDAD LEQAVQTTIT 
AIFFNTGECC CAGSRLFVHE DIKDEFLDEL AAAAEDLTVD DPLLDATDLG PKVTAEQVER 
TMSYIEEAEQ SGAAFVTGGS QPDDEALSDG CFVAPTLIDN IDHDSKAVQE EIFGPVQEVF 
SWSDYDEMIE LANDVDYGLA AGVITENLTK AHQCAKDIEA GNIWINTYND FPAGQPFGGY 
KQSGIGREIG QDAVDHYTQT KTINISLS