Gene Hlac_3397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3397
Symbol
ID	7402248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012030
Strand	+
Start bp	146209
End bp	147432
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	59%
IMG OID	643709943
Product	transposase, IS605 OrfB family
Protein accession	YP_002567509
Protein GI	222481273
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACTACA ACTACAGGTA TCGACTCCGA CCGTCCGACG CTCTCGAACA ACAGTTAGCG 
TGGACTGTCG ATACCTGTAG ACAGGTATAC AACCACTTCC TCCACCGGCT CAACCGCACT 
GACGACACCT CGGCATACAG CGAGCAGAAA CTCCTGCCGA GCCTCAAGAA GTGGTGGAAC 
GACCTGAAAC ACGTTCACTC GAAAGTCCTT CAGAAAGTCG TACAACGGCT GTACGACAAC 
CTCTCAACGC TTCGTGGTCG TAAAGAGAAT GGCTACCACG TCGGGACGCT CAAGTGGAAG 
GCACCGAGCG AGTACCGCAG TTTCACCTAC GGTCAATCCG GCTTCAAGCT CAAGAACACG 
AGCGGTCGGA CTCGGCTGTG GCTCTCGAAG CTCGGAGAAA TCCCGCTCAC CTTCCACCGC 
GCCCTCCCCG ACGACGCCGA AATCAAGACG GTCACAGTCA AACAGGAACC GACCGGGAAG 
TGGTACGCCA TCCTCGGCGT CGAAACCCCG GACGACCCGC CCGCGAAACC GGAGACTCCC 
GAGAAGTGCG TTGGCATCGA CGTAGGGATT CTCAAGTACG CCCACGACAC CGACGGAACA 
GCTGTCGAAT CGTTCGATCT ATCCGATGAA CGTGAGCGGT TGGAACGCGC CCAACGCGAC 
CTCTCGCGGA AGGAACACGG TTCCACAAAT TGGGAGAAAC AGCGCCGTGT CGTGGCCGAG 
CGTCACGCCG AGTTGAAGAA CAAGCGACGG GACTTCCTCC ACAAGCTCTC GAACTACTAC 
GCCCGCGAAT ACGACTTCGT GGCCGTGGAG GACTTGGACG TAAAGGGCTT GATCGAACTG 
CCTGGCAACT CGCGGAACCG AGCGGGAGCG GCGTGGGGAA CGTTCCTACG GATGCTCGAA 
TACAAGTGCG AACGGGAAGG AACGTATTTT ATCGCGGTGA ATCCTCGTGG GACGACGAAA 
GAGTGTGCGT CCTGCGACGC TTCGACGGAG AAGCCGCTGT GGGTGCGGGA GCATTCCTGT 
CCGGCGTGTG GTTTCGAGGC GGATAGAGAC GCGAACGCGG CGTGGAACAT TCTTTCTCGC 
GGTATCACAA AGCGGTTAGG AGCGGGACGC TCCGAATCAA CGCCTGTGGA GACTGCGCTC 
CCTGTGGATA CCTCGGTATC TGCAAAGCGC GTCGTGGAAA CAGGAAGCCC CACCCTCAAG 
CGCGAGCCGT CAGGCGAGCG GTAG

Protein sequence

MNYNYRYRLR PSDALEQQLA WTVDTCRQVY NHFLHRLNRT DDTSAYSEQK LLPSLKKWWN 
DLKHVHSKVL QKVVQRLYDN LSTLRGRKEN GYHVGTLKWK APSEYRSFTY GQSGFKLKNT 
SGRTRLWLSK LGEIPLTFHR ALPDDAEIKT VTVKQEPTGK WYAILGVETP DDPPAKPETP 
EKCVGIDVGI LKYAHDTDGT AVESFDLSDE RERLERAQRD LSRKEHGSTN WEKQRRVVAE 
RHAELKNKRR DFLHKLSNYY AREYDFVAVE DLDVKGLIEL PGNSRNRAGA AWGTFLRMLE 
YKCEREGTYF IAVNPRGTTK ECASCDASTE KPLWVREHSC PACGFEADRD ANAAWNILSR 
GITKRLGAGR SESTPVETAL PVDTSVSAKR VVETGSPTLK REPSGER