Gene Hlac_2192 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2192
Symbol
ID	7401125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2174847
End bp	2176043
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	66%
IMG OID	643709262
Product	lycopene cyclase domain protein
Protein accession	YP_002566839
Protein GI	222480602
COG category
COG ID
TIGRFAM ID	[TIGR03462] lycopene cyclase domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.035344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCG CTCGGCACGA ACACGGACTA CAGGCTGACC TGCGGGCGTT GCTCTCGCAG 
GTCCACCCGG TGTTCATGTT GCCGCCGCTT GCGGCCTCGT GGTTCGGTGC GGCCGTCGCC 
GGCGAGTTCG CGCTCTCGGT GGGCGCGATT CACATGACCG CGATCTTCTT CGCGGTGTAT 
ACGGCACACG TGAAGGACGG CTACGTCGAC TTCCATCGGC GCGGCGAGGA CGACGACCAT 
CCGATGACGA TCCGCGGCTG TCGCCTCTCC CTTCTCGCCG CCGGCGTCGG CTTCGCCGTC 
TGTACGCTCA CGCTCGGAGT ATTCGTCGGC CCGGGCGCCG CGCTCGTCAC CCTTCCGACC 
TGGTTCATCG GGTATCTCCA CGCGCCACAG CTCGATACGA ATCCGCTCAC CACGACGCTG 
GGGTACCCGA GCGGCATCGC GCTCGCGCTG CTCGGCGGGT TCTACGTCCA GACGACCGAG 
ATGACCGCGG CGATACTCGG ATTCGCGCTC GTCTTCCTCG TGACACTCGC CGGGGTGAAG 
ATCATCGACG ACGAACAGGA CTACGCGTAC GACAGATCGA TCGACAAACG GACCGTCTCG 
GTACTGCTCG GCCGACCCCG AGCCCGGACG CTGGCGTTCT CTCTGCTGAT GGCCGGGCTC 
GTCGGCGTTC TCTGGGGGAC AGTCGACGGA CTGTTTCCCC CGTCGGCGCC GGCCGCGGCG 
CTCGCGTTCG CCCCGATAGC ACTGGTGGCC AGACGGGCCC GCCCGACGAT CGCGACGATG 
CTACTGATCC GTGGCGCCTA CGTCTTCCTG GCCGTCCTGA TCGTGGCCGT CTGGTTTCGA 
CCGCTGTCCG GCACCCCGCT TCCGGACATC ACCGTTCTCG GGTCGTACAC GTACCTCGCC 
ACCGAGATCG TCTTCGGCGC GCTCGCGTTC GGCCTGCTCC GCTACGCCGG CGCGCTCCGT 
CAGTCGGCCC GGACGATCGC CGCCCTGTAT CCGATCGCGT ACCTCTGGGA CTGGTACACG 
CTGGAGATCG GCGTCTTCGA GATCACGATG CGCACCGGAT ACGACCTGTT CGGGATCCCG 
ATCGAGGAGC ACCTCTTCAT GATCGTCGTG CCGGCACTTG TCCTCGGCAT TCACGAGACC 
ATCCGGACGC TCTCGGCCGA GTCGGACGAC GCGTCTCGAA GCGATACTCA CAGGTGA

Protein sequence

MAIARHEHGL QADLRALLSQ VHPVFMLPPL AASWFGAAVA GEFALSVGAI HMTAIFFAVY 
TAHVKDGYVD FHRRGEDDDH PMTIRGCRLS LLAAGVGFAV CTLTLGVFVG PGAALVTLPT 
WFIGYLHAPQ LDTNPLTTTL GYPSGIALAL LGGFYVQTTE MTAAILGFAL VFLVTLAGVK 
IIDDEQDYAY DRSIDKRTVS VLLGRPRART LAFSLLMAGL VGVLWGTVDG LFPPSAPAAA 
LAFAPIALVA RRARPTIATM LLIRGAYVFL AVLIVAVWFR PLSGTPLPDI TVLGSYTYLA 
TEIVFGALAF GLLRYAGALR QSARTIAALY PIAYLWDWYT LEIGVFEITM RTGYDLFGIP 
IEEHLFMIVV PALVLGIHET IRTLSAESDD ASRSDTHR