Gene Hmuk_1671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1671
Symbol
ID	8411194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1599700
End bp	1600917
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	57%
IMG OID	645019998
Product	transposase, IS605 OrfB family
Protein accession	YP_003177492
Protein GI	257387719
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATTC AGCGTACTGC TGTCGTCAAA CTTTCCGTCC CCGACCAGCG GCGCGACGAC 
CTGAAACGAA CGATGAACAC GTTTCGGGAC GCTGCACAGC GGTTTGCCAA CCGGGGATGG 
GAAAGAGATG ACAATGGGTA CGTGATAACG TCGCGCTCTC GACTACAACC GCTCGTCTAC 
GACGACATAC GGGACGACAC CGGCCTTCAC TCAGACTTGA CCGTGGCCGC CGTCAACCAT 
GCCGCCGACG CGCTTACCGG CTGTGTAGAC AAAATGAAAG CTGGCGAACG CCCCTCAAAA 
CCTGTGTTCA CGTCGAACAC GACCGTCTAC AACACCAGTG CAATCAGTTA CTTCGACGGA 
TACTGTTCGC TGGCCGCTTA CGGAAGTGGG CGTGTTCATG CTGAATACGT CTACCCAGAC 
GACTCGCTCC AGGCCGAATA CATGGAGAGT AGCGAGTGGA CCAAACAAGG CGCGAAACTC 
CGATACGACC ATCAGACCGA TACCTACTAC TTGCACGTTT CCGTCAAACA GGAACGCGAA 
GATTCGTTGG AAGAGGCCGA GAGCCGAACA GTTCTCGGCG TAGACCGGAA CGTCGACGGG 
TATCTTGCTG TCACCAGTAC AGGAGCGTTC ATCGGCAACG CTGACCTACT GAACCACAAG 
CGCCGCGAGT ATGAACGTCG TCGCGCCCGA CTACAACAAC AGGGGACGCG AAGCGCACAC 
CTCACGATTC AGTCAATCGG TGACACCTTC GCTAACTGGT CCGAGGACGT TCTACACCAA 
ACGTCGAAAC GACTGGTGAA AGAAGCCATG TCACGGGGCT GTTCGGCAAT CGTGTTCGAG 
GACTTGGAAC AGATACGAGA ACGTATCTCG AACGCCTCGA AATTCCAGCA GTGGGCGTTC 
CGCGAGTTGA AGCGCCAGAC GACATACAAA GCCCGTGCCG AAGGAATCGC TGTCGAATCA 
GTCCATCCGG CCTACACCAG CCAGCGGTGT AGTCACGCCG ACTGTGGCTT CACCCACGAG 
GACAACCGCG ACGGCGACCA GTTCACCTGC CAGAAATGCG GGAAAGAACT TCATAGCGAC 
TACAACGCGG CGCGCAACAT CGCACACAGA TTCATCCAGA ACCGGCTCAA GTCTGGTTCT 
GGAGGGGCGA CCCATCACCT CGCCCTGAAG TCGGGAACAG TGAACGGGAA CGGCGACTAC 
TCGCCTTCCA CAGTATAG

Protein sequence

MEIQRTAVVK LSVPDQRRDD LKRTMNTFRD AAQRFANRGW ERDDNGYVIT SRSRLQPLVY 
DDIRDDTGLH SDLTVAAVNH AADALTGCVD KMKAGERPSK PVFTSNTTVY NTSAISYFDG 
YCSLAAYGSG RVHAEYVYPD DSLQAEYMES SEWTKQGAKL RYDHQTDTYY LHVSVKQERE 
DSLEEAESRT VLGVDRNVDG YLAVTSTGAF IGNADLLNHK RREYERRRAR LQQQGTRSAH 
LTIQSIGDTF ANWSEDVLHQ TSKRLVKEAM SRGCSAIVFE DLEQIRERIS NASKFQQWAF 
RELKRQTTYK ARAEGIAVES VHPAYTSQRC SHADCGFTHE DNRDGDQFTC QKCGKELHSD 
YNAARNIAHR FIQNRLKSGS GGATHHLALK SGTVNGNGDY SPSTV