Gene Hmuk_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1946
Symbol
ID	8411474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1856283
End bp	1857539
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	60%
IMG OID	645020277
Product	transposase, IS605 OrfB family
Protein accession	YP_003177766
Protein GI	257387993
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.501136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACGA CGACTAAGAC GCTCGAAGCC ACGCTTGTCC CGCCGACAGC ACACAAAGAG 
CGGAAACTGT GTGACCTGCT CGAAACCTAC CGGGAGGGGC TTCACGAGGC GTTCGACGCC 
AGGTGTGACA CGATGAGCGC AACCAGCGAT GTGGTGACGC CTTACGACCT GCCGTATCAG 
GCGAAAGCGG CGCTGTGCAA CTACGTCCCG CAACTTCACA ACACCTACGA CGCTCAAGAG 
TTAGACGATG ACCACCCGGT TCGGCTCACC AACCAAGCCG CCGAGTTTGA CCACTCTCCG 
GCGCGTGACT ACGAGTTTAC GTGGTGGGCA CCACAACCCG GTCGTGGGAC GAATTTCTGG 
ATACCGCTTC GTATCAATCC CGAACAGGAG GATCTGTGGC ACGACCTCGT AGATGGGAAC 
GCTTCGGCAG GCCAACTCCG CCTGCAACGG AACCGCACAT CGTGGACGTT ACACGTCACT 
GTCGAGTTTC CGGTCGAAGA ACCCGACTAC GCGACGGACG GCGACGACGT GACGCACATC 
GGTCTGGATA TTGGTGAAAC TGCCCTGATA ACGGGCTGTG CCCTCAAGGA CGGTTCACCA 
ACTGGCCCGT TCGTGTGTGA CGGGAGCCGT GCGAAGCATC TCCGCAAAGA GATGCACACC 
ACCCTGAAAC GACTCCAAGA GCGAGACGCC GTCGAGTGGC GGATTGACGA GCGATTCAAC 
CACTACCAGA ACGCGCTTAC CGATATTGTC GAGAAGGCGT CTCGGCAGGC CGTCGAGTAC 
GCCCGGCAAT TCGAGAAGCC GGTGCTGGTA ATGGAGAACC TGACGTACAT CCGCGAAGAA 
TTGGACTACG GTTCGTACAT GAACCGGCGA CTCCATGCGT GGGCGTTCGC TCGATTACAG 
AACCGCGTCG AGGACAAATC GAAAGAGGCC GGTATCCCGG TCGAATACGT CCGACCGGAG 
TACACCAGCC AGACGTGCCA CGCCTGCGGC CACATCGGAA ACAGAGCCGC GCAAGCCACG 
TTCCGGTGTA CCAACGACGA GTGTCACATC ACGGAGTTTC AGGGCGATAT AAACGGCGCA 
ATCAACGTTG CACAACGGGC TGACCCGTGG GGAGAGAGCG TGCCGCTGAA ACCGGCAGGC 
AATGACTCGC CTCGGGATGG GAGTGCCTGT GACAGCACCA CGACCCACAC CAAGCAGAGC 
CAACCACGGC AGATGACGCT TAGCGAGGTC GGGTCGGAAC CCACTGCCGG TAGTTGA

Protein sequence

METTTKTLEA TLVPPTAHKE RKLCDLLETY REGLHEAFDA RCDTMSATSD VVTPYDLPYQ 
AKAALCNYVP QLHNTYDAQE LDDDHPVRLT NQAAEFDHSP ARDYEFTWWA PQPGRGTNFW 
IPLRINPEQE DLWHDLVDGN ASAGQLRLQR NRTSWTLHVT VEFPVEEPDY ATDGDDVTHI 
GLDIGETALI TGCALKDGSP TGPFVCDGSR AKHLRKEMHT TLKRLQERDA VEWRIDERFN 
HYQNALTDIV EKASRQAVEY ARQFEKPVLV MENLTYIREE LDYGSYMNRR LHAWAFARLQ 
NRVEDKSKEA GIPVEYVRPE YTSQTCHACG HIGNRAAQAT FRCTNDECHI TEFQGDINGA 
INVAQRADPW GESVPLKPAG NDSPRDGSAC DSTTTHTKQS QPRQMTLSEV GSEPTAGS