Gene Hlac_3228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3228
Symbol
ID	7399352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	+
Start bp	482451
End bp	483710
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	60%
IMG OID	643707023
Product	transposase, IS605 OrfB family
Protein accession	YP_002564645
Protein GI	222476124
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCACGA CCGTCACGAA GACGTTGCAG GCGACGTTCG CACCCCCCAC CGCGCACAAG 
CAGTCGAAAC TCAACGACCT GCTCGAAACC TACCGTGACG GTCTGCAAGA AGCGTTCGAC 
GCCGGGGCGA GTACCATGTC CTCGGTGAGC GACATCGTGA CGCCCTACGA CTTGCCGTAT 
CAGGCCAAAG CCGCGCTCTG CAACTACGTC CCGAAACTCC GCAAGACGTA CAACGCGCAG 
GATTTGGACG ACGAACACCC GATACGACTC ACGAACCAAG CCGCGAAGTT CGACCACTCG 
GAAGAACGCG ACTACGAGTT TACGTGGTGG GTTCCTCGTC CCGGTCGGGG AACGAATTTC 
TGGATGCCGC TCCGCATCAA TCCCGAACAG GAAGACCTCT GGCACGACCT CGTATCCGAG 
GACGCGAAAG CGGGCGAGAT ACGGCTTCAA CAGCATCGGA AGAATTGGGT ACTACACGTC 
ACCGTCGAGT ACCCGGTTGA AGAACCAGCG GCGGACGGTG ACGCCACGCA CATCGGCTTA 
GACATCGGAG AAACCGCCCT CATCACGGGC TGTGCCCTCA AGGACGGTTC TCCGACTGAC 
CCGTTCGTGT GTAGCGGAAG CAGAGCGAAG CATCTCCGAA AAGAGATGCA CACGACCCTG 
AAACGACTGC AAGAGCGTGA CGCTTCGGAG TGGCGTACCG ACGAACGGTT CGACCACTAC 
CAGAACGCCC TCACCGACAT CGTGGAGAAA GCGTCTCGGG AAGCCGTCGA GTACGCCAAG 
CAGTTTGAAA ATCCGGTGTT GGTGATGGAG GACTTGACGT ACATCCGTGA GCGTCTCGAC 
TACGGGAAGT ACATGAACCG TCGGCTTCAC TCGTGGGCGT TCGCCCGACT CCAAGGGCGC 
ATCGAGGACA AGGCGACGGA AGCAGGTATT CCGGTCGAGT ACGTGAATCC GGCGTACACC 
TCGCAGACGT GCCACTCGTG CCACCGCATC GGTCGGCGGG ACTCGCAGGC CGAGTTCCGG 
TGTCCGAACG ATGACTGCCA CGTTTCGACG TTTCAGGCCG ACATCAACGC TTCCGCGAAT 
ATCGCACGAC GGGTTGACCC GTGGGGAGAG AGCGTCCCGC TTGACAAGGC CGGACGCGAT 
GACTCGCCTC GGGATGGGAG CGGTTGTGAC ACCGCCACGA CTCACCGTGA GAAGAGCGTA 
CCAGCGCAGA TGACGCTCAC GGCCTACGAA GAGTCGAAAC CCTCTACCAG CGACGACTGA

Protein sequence

MSTTVTKTLQ ATFAPPTAHK QSKLNDLLET YRDGLQEAFD AGASTMSSVS DIVTPYDLPY 
QAKAALCNYV PKLRKTYNAQ DLDDEHPIRL TNQAAKFDHS EERDYEFTWW VPRPGRGTNF 
WMPLRINPEQ EDLWHDLVSE DAKAGEIRLQ QHRKNWVLHV TVEYPVEEPA ADGDATHIGL 
DIGETALITG CALKDGSPTD PFVCSGSRAK HLRKEMHTTL KRLQERDASE WRTDERFDHY 
QNALTDIVEK ASREAVEYAK QFENPVLVME DLTYIRERLD YGKYMNRRLH SWAFARLQGR 
IEDKATEAGI PVEYVNPAYT SQTCHSCHRI GRRDSQAEFR CPNDDCHVST FQADINASAN 
IARRVDPWGE SVPLDKAGRD DSPRDGSGCD TATTHREKSV PAQMTLTAYE ESKPSTSDD