Gene Hlac_3334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3334
Symbol
ID	7402190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	-
Start bp	86164
End bp	87501
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	60%
IMG OID	643709886
Product	transposase (ISH6)
Protein accession	YP_002567452
Protein GI	222481216
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGCCA CAATCGACGT GCGGTTCGAA CTGAGTATCG ACGACGACAA AACGCTACCG 
CTCGCCACGC TTGCCGAGGC CGTCACTGAC CAGAACCTCG AAGCAGTCCT TCTCGAATCG 
CTGGTCGAGA GCCTCGACGC CGCCAGCGTC GAGGCGCTCT GTGGTGAGAA ACACGCACAT 
GGCAACGGTG ACCAGCGCTT CCAACGCGCC GGCACCGACA CCCGCACAGC TGTCACAACT 
GCCGGAGAAC ACGAGTTCTC TCTCCACTAC GTCGAAGATA CAGCCGCTTC CCCAGACGAA 
TCCAGCTACT TCCGGCCCGT CGAAGACGTT CTCGACTTCG ACGGGCAGAA CCGCTATCAG 
CAGGACATCG CCGCCAAAAG CGTCGATCTC GCTACCTCGC TCAGCTATCG AGACGCTGCC 
AATCACGGCG ACAGCTTCGT CTCGATGCCG TCGCCGACCA CCATCAACCG CCGTGCCAAG 
AAATACGGCC ACAAGCTCAA ACAGTTCCTT CCAGACTGTG TCGCTGGCAC AGACGCTGAC 
GCCGTCATTC CTGACGGGAC AAAGTGCCAC AGCCAAGACG ACGACCGCTC GTCCCACTCC 
GTCCAAGCAA CGCTCGGCGA AGACACCGCC GAAGAGTCAC GCTCCCTGCT GGATCTGTCG 
GTCAACGCTG ACTGGGACGA AACTGCCGCC GAACTCGATG ATATCGGCGC AGTCACTGAC 
GACGCGACGG TCGTCAGTGA CGCTGATAGC GGCATCGTCA CAGCCTTTAC CGACGAAAAC 
CGTGACCACC AGCTCGATCT CGTCCACGTC GGCCGAACGC TGGGTTACAC CCTCTGGGAC 
GATGGCGTCT TCTCCTTGGA CCGTCGGAAG GAGATCGTTT CGGAGGTGAT CGACGAGGTG 
TTCCATCTGA AGAACTCTGT GGCGAAGCAT CGTCCAGCGG AGGAGTTCGC GGCGATCCGC 
TCGCGGATCG CGCGAACGAG AGAGCGATTA GAGAAGACAG CGTGGCAACT GGAGCAGTTC 
GGGTCAGCAA AGGCTGCAGG GTATCTTCGG CGGTGGCTGC CGTCGATTGT GACGTTCGCC 
GAGCACGCTG TCGAGGGGTT CGAGGTTCCG TGGACCTCGA ACCCCGTCGA ACGACTGATG 
GGCGAGGTCA GCAAGCGGTG CAAGAACCAG TGGATGCGCT GGACAGCAGA GGGATTGGAA 
GCGATACTCC AACTTCGGTT GGTGAAGTAC GCCGACCCCG AGTACTACCA AGCGTTCCTC 
GACGAACTGC TCCAACGTTC GACCAAAACA GCAATCAACT GTGACCTCTC AATTGAGAGT 
ACCAGCGGCA AAGTCTAG

Protein sequence

MHATIDVRFE LSIDDDKTLP LATLAEAVTD QNLEAVLLES LVESLDAASV EALCGEKHAH 
GNGDQRFQRA GTDTRTAVTT AGEHEFSLHY VEDTAASPDE SSYFRPVEDV LDFDGQNRYQ 
QDIAAKSVDL ATSLSYRDAA NHGDSFVSMP SPTTINRRAK KYGHKLKQFL PDCVAGTDAD 
AVIPDGTKCH SQDDDRSSHS VQATLGEDTA EESRSLLDLS VNADWDETAA ELDDIGAVTD 
DATVVSDADS GIVTAFTDEN RDHQLDLVHV GRTLGYTLWD DGVFSLDRRK EIVSEVIDEV 
FHLKNSVAKH RPAEEFAAIR SRIARTRERL EKTAWQLEQF GSAKAAGYLR RWLPSIVTFA 
EHAVEGFEVP WTSNPVERLM GEVSKRCKNQ WMRWTAEGLE AILQLRLVKY ADPEYYQAFL 
DELLQRSTKT AINCDLSIES TSGKV