Gene Hlac_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1105
Symbol
ID	7400914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1110911
End bp	1112179
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	71%
IMG OID	643708171
Product	Saccharopine dehydrogenase
Protein accession	YP_002565770
Protein GI	222479533
COG category	[S] Function unknown
COG ID	[COG3268] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CCGATCGGAC ACACGACATC GTGGTGTGGG GCGCAACGGG CGTCGCCGGA 
CGCTTCGTGG CCGAGTACCT GACCGAACGG TACGCGCCGG ACGACCTCTC GCTGGCTGTC 
GGCGGGCGGA GCCCGGAGCG ACTCGAACAA CTCGTTAGTG ACCTTACCGG CCGCAGCGAC 
GCGTGGGACG ACGTTCCCGT CGTCGTGGGC GACGCGACTG ATCCCGAAAG TCTGCGCGCC 
ATCGCCCGGG ACACGCGGGT CGTCTGTACG ACCGTCGGTC CGTACACGAC GTACGGAACG 
CCGCTGGTCG ACGCCTGCGT CGAGGCCGGC ACGGACTACT GCGACCTCAC CGGCGAGATA 
AACTGGGTGC GCGAGATCAT CGACCGGTAC CACGAGGCAG CGGTCGACGC CGAAGCTCGG 
ATCGTCCACA GCTGCGGTTT CGACTCCGTA CCTGCGGATC TCGGAACGCT GCTCGCCCAG 
TCGTTCGCAG TGGAGACGTT CGACGCACCC TGTCAGACGG TTCGGATCTA CCTCGAAGGC 
GGGAGCGGCG GTGTCAGCGG GGGCACCTTG GCGAGTTTCG GCGAGGTGTT TGAGGCGGCC 
GCCACCGACC CACTGGCCCG CCAGACGCTC CGGAATCCGT ACTCGCTGGC GCCGCCCGGT 
GAGCGGAGCG GTGTCGATCC CGGTGAGCAG CGACGCCCGC GGAGGGACTC CCTGCGCTCG 
GCGTGGACGG CTCCCTCGCC GATGGCACCG GTAAACGAAC GAGTGGTACG ACGGAGCAAC 
GCGCTCCTCG GGTACCCGTG GGGCCGCGAG TTCCGGTGTA CGGAGGTCGT GCCGACCGGC 
GACGGACTCA CCGGGGCGGC CACGGCCGGT CTCGTTGCCG TCGGACTCGG TGCGTTCACG 
GCCGCCATGT CCGTCGGACC GGTGCGCTCG GCGCTCCGTC GGTACGTCTT CCCGGACCCC 
GGCGAGGGAC CGACGAGAGA GGAGGCCGAG GCCGGGCACT TCTCGATTCG CGTGCTCGGG 
CGGGGCACGG CCGCGGACGG GCCGTTCACC GTCGAGGTCG AGTTCGGCGC CGATCGGGAC 
CCGGGCTACG GGGCGACCGC GCGGATGCTC GGCGAGGCGG CGGTGTGTCT GGCGACCGGC 
GACGTCGACT CGCCGCTCGA CGGCGGCGTG CTGACGCCGG CGTCGGGGAT CGGTCTGCCG 
CTCGCGGAGC GACTCCGCGA CGTCGGCTTC ACCGTGTCGG TCGGCGAGGC GTCAGATACC 
CGACGCTGA

Protein sequence

MTDADRTHDI VVWGATGVAG RFVAEYLTER YAPDDLSLAV GGRSPERLEQ LVSDLTGRSD 
AWDDVPVVVG DATDPESLRA IARDTRVVCT TVGPYTTYGT PLVDACVEAG TDYCDLTGEI 
NWVREIIDRY HEAAVDAEAR IVHSCGFDSV PADLGTLLAQ SFAVETFDAP CQTVRIYLEG 
GSGGVSGGTL ASFGEVFEAA ATDPLARQTL RNPYSLAPPG ERSGVDPGEQ RRPRRDSLRS 
AWTAPSPMAP VNERVVRRSN ALLGYPWGRE FRCTEVVPTG DGLTGAATAG LVAVGLGAFT 
AAMSVGPVRS ALRRYVFPDP GEGPTREEAE AGHFSIRVLG RGTAADGPFT VEVEFGADRD 
PGYGATARML GEAAVCLATG DVDSPLDGGV LTPASGIGLP LAERLRDVGF TVSVGEASDT 
RR