Gene Hlac_1128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1128
Symbol
ID	7400937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1137597
End bp	1138856
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	60%
IMG OID	643708193
Product	transposase, IS605 OrfB family
Protein accession	YP_002565792
Protein GI	222479555
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCACGA CCGTCACGAA GACGTTGCAG GCGACGTTCG CACCCCCCAC CGCGCACAAG 
CAGTCGAAAC TCAACGACCT GCTCGAAACC TACCGTGACG GTCTGCAAGA AGCGTTCGAC 
GCCGGGGCGA GTACCATGTC CTCGGTGAGC GACATCGTGA CGCCCTACGA CTTGCCGTAT 
CAGGCCAAAG CCGCGCTCTG CAACTACGTC CCGAAACTCC GCAAGACGTA CAACGCGCAG 
GATTTGGACG ACGAACACCC GATACGACTC ACGAACCAAG CCGCGAAGTT CGACCACTCG 
GAAGAACGCG ACTACGAGTT TACGTGGTGG GTTCCTCGTC CCGGTCGGGG AACGAATTTC 
TGGATGCCGC TCCGCATCAA TCCCGAACAG GAAGACCTCT GGCACGACCT CGTATCCGAG 
GACGCGAAAG CGGGCGAGAT ACGGCTTCAA CAGCATCGGA AGAATTGGGT ACTACACGTC 
ACCGTCGAGT ACCCGGTTGA AGAACCAGCG GCGGACGGTG ACGCCACGCA CATCGGCTTA 
GACATCGGAG AAACCGCCCT CATCACGGGC TGTGCCCTCA AGGACGGTTC TCCGACTGAC 
CCGTTCGTGT GTAGCGGAAG CAGAGCGAAG CATCTCCGAA AAGAGATGCA CACGACCCTG 
AAACGACTGC AAGAGCGTGA CGCTTCGGAG TGGCGTACCG ACGAACGGTT CGACCACTAC 
CAGAACGCCC TCACCGACAT CGTGGAGAAA GCGTCTCGGG AAGCCGTCGA GTACGCCAAG 
CAGTTTGAAA ATCCGGTGTT GGTGATGGAG GACTTGACGT ACATCCGTGA GCGTCTCGAC 
TACGGGAAGT ACATGAACCG TCGGCTTCAC TCGTGGGCGT TCGCCCGACT CCAAGGGCGC 
ATCGAGGACA AGGCGACGGA AGCAGGTATT CCGGTCGAGT ACGTGAATCC GGCGTACACC 
TCGCAGACGT GCCACTCGTG CCACCGCATC GGTCGGCGGG ACTCGCAGGC CGAGTTCCGG 
TGTCCGAACG ATGACTGCCA CGTTTCGACG TTTCAGGCCG ACATCAACGC TTCCGCGAAT 
ATCGCACGAC GGGTTGACCC GTGGGGAGAG AGCGTCCCGC TTGACAAGGC CGGACGCGAT 
GACTCGCCTC GGGATGGGAG CGGTTGTGAC ACCGCCACGA CTCACCGTGA GAAGAGCGTA 
CCAGCGCAGA TGACGCTCAC GGCCTACGAA GAGTCGAAAC CCTCTACCAG CGACGACTGA

Protein sequence

MSTTVTKTLQ ATFAPPTAHK QSKLNDLLET YRDGLQEAFD AGASTMSSVS DIVTPYDLPY 
QAKAALCNYV PKLRKTYNAQ DLDDEHPIRL TNQAAKFDHS EERDYEFTWW VPRPGRGTNF 
WMPLRINPEQ EDLWHDLVSE DAKAGEIRLQ QHRKNWVLHV TVEYPVEEPA ADGDATHIGL 
DIGETALITG CALKDGSPTD PFVCSGSRAK HLRKEMHTTL KRLQERDASE WRTDERFDHY 
QNALTDIVEK ASREAVEYAK QFENPVLVME DLTYIRERLD YGKYMNRRLH SWAFARLQGR 
IEDKATEAGI PVEYVNPAYT SQTCHSCHRI GRRDSQAEFR CPNDDCHVST FQADINASAN 
IARRVDPWGE SVPLDKAGRD DSPRDGSGCD TATTHREKSV PAQMTLTAYE ESKPSTSDD