Gene Hlac_3051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_3051
Symbol
ID	7399025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012028
Strand	+
Start bp	309938
End bp	311236
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	643706858
Product	transposase, IS605 OrfB family
Protein accession	YP_002564480
Protein GI	222475959
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACTACA CCTACAGATT TCGGCTTGAT CCCACGCCTG AACAGCGTGA ACTGTTGGAT 
CATCACCGAG ATACCTGTAG GCAACTCTAC AACCACGCAC TCAACGAATT CAAGCAAATT 
CCCAAATCGG CGGGTACACT TAACCAACGA GTGCGACAAG TACGCGATCA GCTCACCAGC 
CTCAAAGACT GGTGGGATGA GCTGAACGAT GTCTATTCAA CGGTCGCACA AGCTGCTGTC 
ATGCGTATCG AAGACAGCAT CAAAGCCCTC TCTCAGTTGA AGCAGAACGG CTACAACGTG 
GGCAGTCTCA ATTGGAAGGC CCCCAAGGAT TTCCGTAGTT TCACCTACAT ACAGTCTGGC 
TTCGAGTTCG ATAGTAAGAA CGGCCAACCC GTACTGTCGC TGTCGAAACT TGCGGATATT 
CCCCTCATCA AACACCGCGC AATTCCTGAC GCCGAGACTG TCAAAGAAAT CACGATTAAG 
AAGGAGTCAA CCGGTGAATG GTTCGCTTCA TTCACCGTCG GCGATAAAGA GACTCCTGAG 
AAACCGACCG ACCCAGATCG ATGTGTCGGG ATTGACGTTG GCATCTTGAA GTACGCCCAT 
GACACAGACG GCACCGCCGT CGAATCGCTC GACTTATCTG ACGAACGCGA GCGGTTGGAA 
CGCGCACAGC ATGATCTTTC GCAGAAGGAA CGCGGTTCCG CGAATTGGGA GAGACAACGG 
CAAGTTGTGG CCGAGCGCCA CGCCGATCTC AAGCGAAAGC GTCGTGACTT CCTTCACAAA 
CTCTCGAACT ACTACGCCAC CGAATACGAC CTCGTAGCGG TCGAAGGCCT CGACGCGAAG 
GAGTTGGTCG AACTCCCCGG AAACTCACGG AATCGGGCGG GAGCGGCGTG GGGAACGTTC 
CTTCGAATGC TTGAGTACAA GTGCGAACGC GAAGGAACAC ACTTTGCCGA AGTCGATCCA 
AGGAACACGA CGAAAGCGTG CGCGTCTTGC GGCGTCAAGA CGGACAAGCC GTTGTGGGTT 
CGTGAACACT CGTGTCCCTC GTGTGGGTTT GAGGCGGACA GGGACGCGAA CGCAGCGTGG 
AACATTCTTT CTCGCGGTCT TAAAAATATA GGAGTGGTTC ACTCCGAATC AACGCCTGTG 
GAGACTGCGC TCCCTACGGA CACCGTTGTG TCTGCAAAGC GCGTCATCGA AACAGGAAGC 
CCCATCACCA GAAGTCAAAG ACTTCGGGTT AGCAGTCAGA ACTCGGAGAG TTCTGACGAC 
ACCCTCAAGG AGCGAACGGC GTCAGCCGTG AGCGAGTAG

Protein sequence

MHYTYRFRLD PTPEQRELLD HHRDTCRQLY NHALNEFKQI PKSAGTLNQR VRQVRDQLTS 
LKDWWDELND VYSTVAQAAV MRIEDSIKAL SQLKQNGYNV GSLNWKAPKD FRSFTYIQSG 
FEFDSKNGQP VLSLSKLADI PLIKHRAIPD AETVKEITIK KESTGEWFAS FTVGDKETPE 
KPTDPDRCVG IDVGILKYAH DTDGTAVESL DLSDERERLE RAQHDLSQKE RGSANWERQR 
QVVAERHADL KRKRRDFLHK LSNYYATEYD LVAVEGLDAK ELVELPGNSR NRAGAAWGTF 
LRMLEYKCER EGTHFAEVDP RNTTKACASC GVKTDKPLWV REHSCPSCGF EADRDANAAW 
NILSRGLKNI GVVHSESTPV ETALPTDTVV SAKRVIETGS PITRSQRLRV SSQNSESSDD 
TLKERTASAV SE