Gene Hlac_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1086
Symbol
ID	7400158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1087689
End bp	1088993
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	55%
IMG OID	643708152
Product	transposase, IS605 OrfB family
Protein accession	YP_002565751
Protein GI	222479514
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGGCG TAATTCGCAC CGCTAAAGTT AAACTTGACG TACCCAGCGA GCGGTGCGAC 
GATCTCCATC AGACGAAAAA TCAGTTCCTC CACTGTGCGA ACATCACTTC AGAGTGGGCG 
TGGAAACACC CGAACGACTA CTGCGTAACC TCCAAACAGA AAGCCGAGAA CGCTCTCTAC 
GACCAACTTC GTAACGAGAC GGAGTTGACC GCGAATCTCG TTCAGAAAGG GATCCGGCGT 
GCTATTGAGG CCACAAAAAG TGGTGTTGCC CGTCTCAAAA AACAGGAGAG AACGAGTCAA 
CCGCACTTCG ACGCGTGGAG CGTCGTCTAC GACAAGCGAA GTGCGACGTT CCACCGTGAC 
CACGTTTCGC TCTCAACTGT GAACGGTCGC GTTGAGTGTG ACTACGTGAT TCCCGACGAT 
CCCGAGGAAA CACCGATCGG TGAGTACCTG TTGAACGAGG ACTACGAGTT CCGTATGTCC 
ACGTTGCAGT ACGACCGCTC CACAGAGTCG TTCTATCTCC ACGCAAAAAT GCGCCGAACC 
GAACGTGACG AGAAAGAGCA GTCTACGACT ACTTTTGATG ACGCCAAGCA CAGAACAGTC 
CTTGGCGTTG ACCTGAACGT GGACGGCTCG CTCGCCGTGA CTTCGACAGG CGTGTTCATC 
GGGAATGCCG ACGAAATGAA TCATCGACGC CGAGAGTTCG AGAAGACCCG CGGGTCGATG 
CACCAGACGG GCACGCGGTC GGCACACCTG TCGATTCAGT CGATGAACGA CCGCGAACAC 
CGGTGGATGC AGGACGAGCT GCACCGAGCC TCGAACCGGA TTCTGGAAGA AGCCCACGAA 
CACGACTGCA CGCATATCGC GTTCGAGAAT CTGACGGACA TTCGCAAGCG GATGGCGGGT 
GCGAAGCGAT TCCATGCGTG GGCGTTTCGA CGCCTGTACC AGTACGTCGA ATACAAAGCT 
GAGATGATCG GGATCGAGGT CGAGCAGGTG AGTCCGGCGT ACACGTCTCA ACGGTGTTCG 
TCATGTGGGT TTACGCACGA AACTAATCGA CAGTCGAAGC ACCAGTTTGT CTGTCAGAAG 
TGCGAGTACG AACTGAACGC CGACTATAAC GCGAGCAAGA ATATCGGTCA CAAACTTCTC 
AAACGCCTCC GCTCGGGGCA GAAGTCTTCG AGCGGAGGCG CACCCTGTCA GTGTGCGCTG 
AAGTCAGGGA CATTGAACCT GAATGGTGAT TTCTACGCCT CCGTCGAGTC GACGGCAGAA 
GGGGAGTCTA CTGACAAGCC CACGACTTCA GTCGTGGGTA ACTGA

Protein sequence

MEGVIRTAKV KLDVPSERCD DLHQTKNQFL HCANITSEWA WKHPNDYCVT SKQKAENALY 
DQLRNETELT ANLVQKGIRR AIEATKSGVA RLKKQERTSQ PHFDAWSVVY DKRSATFHRD 
HVSLSTVNGR VECDYVIPDD PEETPIGEYL LNEDYEFRMS TLQYDRSTES FYLHAKMRRT 
ERDEKEQSTT TFDDAKHRTV LGVDLNVDGS LAVTSTGVFI GNADEMNHRR REFEKTRGSM 
HQTGTRSAHL SIQSMNDREH RWMQDELHRA SNRILEEAHE HDCTHIAFEN LTDIRKRMAG 
AKRFHAWAFR RLYQYVEYKA EMIGIEVEQV SPAYTSQRCS SCGFTHETNR QSKHQFVCQK 
CEYELNADYN ASKNIGHKLL KRLRSGQKSS SGGAPCQCAL KSGTLNLNGD FYASVESTAE 
GESTDKPTTS VVGN