Gene Hlac_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1920
Symbol
ID	7399872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1923552
End bp	1924424
Gene Length	873 bp
Protein Length	290 aa
Translation table	11
GC content	71%
IMG OID	643708991
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_002566568
Protein GI	222480331
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.108282
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCATCGA ACGACCTTTC CGACCGCGTG ATCGCCCTCA CGGGCGCGAC CAGCGGTATC 
GGCCGTCGTG CGGCCGTGAC GCTGGCCGAA CGCGGAGCCA CCGTCGCCGC AGTCGGGCGG 
AATCGGGAGC GTGGCGAGGC GCTCGCCGCC GAGAGCGACG CGGCGGCCGG GACGATCCGG 
TTTCACCGCG CCGATCTGGC GACCCAGTCG GCGGTTCGCG ATCTGGCCGC CGAACTCCGC 
GAATCGTACG ATCGGCTCGA CGTTCTCGCG CACAACGCCG GGCTCTCGGT GAGGTCGCGG 
ACGGAGACCG CAGACGGGAT CGAACTCACG CTGGCCGTGA ACCACCTCGC GCCGTACCTC 
CTCACCCGCG AGCTGTTCGA CCAGCTCGCC GGCTCGGCGC CCGCCCGGGT CGTCGTCACC 
GCCTCCGACC TCCATCGGCG TGCGACGCTC GACTTCGACG ACCTCCAGTT CGCCGACGGC 
TACGACCCCT TGGAGGCGTA CGCCCGATCG AAGCTCGCGA ACGTCGCGTT CACGCTCGAA 
CTCGCCGATC GGATCCCGGA GGCAGCGGGA GTCACGGCGA ACTGCCTCCA TCCGGGGTTC 
GTCCCCTCGA CGAACCTGTT CCGCGACGCC GCGCTCCGAA CCCGGCTCGC GGTCCGCATC 
GCGGGGCTCC TGCCCGGCGT CGGGACGACG CGCCGAGCCG CGGCCGACCG CCTCGTACGA 
CTCGTCGCGT CACCGGAGTA CGCCGAGCGA ACCGGTCGCT ACGTCGGCGA GGAAGAAATG 
ACGCCCGCGG ACGACACGGT CGACTCCGAG ACGCGCGAGC GGCTCTGGAG CGTCAGCGCC 
GACCTCGTCG GGATCGACCC CGACTGGCCG TGA

Protein sequence

MSSNDLSDRV IALTGATSGI GRRAAVTLAE RGATVAAVGR NRERGEALAA ESDAAAGTIR 
FHRADLATQS AVRDLAAELR ESYDRLDVLA HNAGLSVRSR TETADGIELT LAVNHLAPYL 
LTRELFDQLA GSAPARVVVT ASDLHRRATL DFDDLQFADG YDPLEAYARS KLANVAFTLE 
LADRIPEAAG VTANCLHPGF VPSTNLFRDA ALRTRLAVRI AGLLPGVGTT RRAAADRLVR 
LVASPEYAER TGRYVGEEEM TPADDTVDSE TRERLWSVSA DLVGIDPDWP