Gene Hmuk_1581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1581
Symbol
ID	8411103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1506527
End bp	1508161
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	72%
IMG OID	645019907
Product	protein of unknown function DUF255
Protein accession	YP_003177402
Protein GI	257387629
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1331] Highly conserved protein containing a thioredoxin domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.397722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGT TCGCAGCGGA GACGAAAGTC GAGTGGCGCG AGTGGGGGCC GGCGGCCTTC 
GAGGCTGCGC GGGAGGCCGG CAAGCCGATC CTGCTCGCGC TGACGGTGCC CTGGAGCCCC 
GAGTGTCGCG AGATGGACCG CAAGACGTAC GCGGAGCCAC GGATCGCGGC CAACGTCAAC 
GACGGCTTCG TCCCGGTCCG GGTCGACGGC GACCGCCACC CCGAGGTGCG CGAGCGATAC 
ATCATGGGTG GGTTTCCGTC GACGGTGTTT CTCACGCCCG AGGGGACAGT GCTGACCGGG 
GCGACGTATC TCGGACCCGA CGGCTTCCGT GGGATCCTCG ACAGCGTCCG CGAGACGTGG 
GAGACGGAGG GAGAGGCCGC TGGTTCCGTC CCGCGCTCGC TCCAGACCGA CGCGCCACCA 
GCGGGCGAGG TGACCGCACG GATCGAGGAG GCGATGGTCG AGCAGTTGCT CGCGGCTTAC 
GACGAGGAGT ACGGCGGCTG GGGCACCGAC GTGAAGTTCC CGTTGCCACG GACCGTCGAG 
TTCGCGCTGG TGCGGGCTCG CGACCAGGCG ACACGGACGC TGGAGGCGAT TCAGACGCAC 
CTTCGGGACA CCGACGACGG CGGGTTCTAT CGCTACGCGA ACGGCCGGAC GTGGTCGGAC 
GCGCGGACAG AGCGACTCCT CGACGAGAAC GCCGCTCTGG TCAGAGCGTT CGCTCACGGC 
TATCGCTACA CGGGGGAGGA GGCCTATCGC GAGACCGCAG AGCGCGCCAT CGAGTACCTG 
ACGACGAAGC TGTGGGTCGA CACCAGCGGG GACACCAGCG GTGCGTTCGC CGGCAGTCAG 
GCCGGCGACG ACACGTATCA CCGGCTGGAC GCCAGCGATC GGGCCTCGGC GGATCCACCC 
CGGGTCGACG AGACGGTCTT CGCCGACCGG AACGGGATGG CCATCGACGC GCTGGCGACG 
TACGCCGCCT ACACCGACGA CGAGCGCGCT CGCCGGTACG CCGAGCGCGC TCGCGAGACG 
ATCGCCGAGA CGCTCGTCGA GAACGGCGCG GCCACGCACT ACCGGACCGA CGAGGCCGTG 
GGGCCGACCG GGCTCCTCCT CGACCAGGCG CGGGTCCTGC AGGGACTGAC GACCAGCTGG 
CAGGTGCTCG GCGAGGGCGG CCCCGCCAGA GCGATCGCCG ACTGGGCGAT CGAGCACCTC 
CAGACCGAGA GCGGCGCGTT TCGCGACGGA CCGGCCGACG GGCCGGGTCT GTGCTCGCGT 
TCGCAGTACC CGCTCGACGC GACCGTCGAG CTGGCCGACG CCTTGCTCGA CCTGGCCGCG 
CTCGCCGACG ACGAGCGCTA CCGGGAGGCC GCTCACGGTG CCATCGCCGC CTTCGCCGGT 
GCGTCCGACC GGATGGGCGT CGAAGTTGCA CACTACGCGG CCACGGCCGC CCGGCTCCGA 
TCGCCCGCCG TCCTTCGCGT CGGGCCGCGG GCCGGGAGCG ATCTCCACCG GGCCGCACTC 
CGGCTGGCCG ACCACGAGAC CGTCGTCGTC CCCGATGCTG GCGGCGACGA GGCGGTCCTG 
TTCGAAGACG GCGAGCGGGT CGGCACCGCC GAGGAGCCGG CGGGGCTCGA AGCCGTCCTG 
ACGGGCGACG CGTAA

Protein sequence

MDQFAAETKV EWREWGPAAF EAAREAGKPI LLALTVPWSP ECREMDRKTY AEPRIAANVN 
DGFVPVRVDG DRHPEVRERY IMGGFPSTVF LTPEGTVLTG ATYLGPDGFR GILDSVRETW 
ETEGEAAGSV PRSLQTDAPP AGEVTARIEE AMVEQLLAAY DEEYGGWGTD VKFPLPRTVE 
FALVRARDQA TRTLEAIQTH LRDTDDGGFY RYANGRTWSD ARTERLLDEN AALVRAFAHG 
YRYTGEEAYR ETAERAIEYL TTKLWVDTSG DTSGAFAGSQ AGDDTYHRLD ASDRASADPP 
RVDETVFADR NGMAIDALAT YAAYTDDERA RRYAERARET IAETLVENGA ATHYRTDEAV 
GPTGLLLDQA RVLQGLTTSW QVLGEGGPAR AIADWAIEHL QTESGAFRDG PADGPGLCSR 
SQYPLDATVE LADALLDLAA LADDERYREA AHGAIAAFAG ASDRMGVEVA HYAATAARLR 
SPAVLRVGPR AGSDLHRAAL RLADHETVVV PDAGGDEAVL FEDGERVGTA EEPAGLEAVL 
TGDA