Gene Hmuk_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1066
Symbol
ID	8410585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1014990
End bp	1016084
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	68%
IMG OID	645019402
Product	aldo/keto reductase
Protein accession	YP_003176900
Protein GI	257387127
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.115194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGC GGGAACTCGG AACGTCAGGC GTCGAAGTTT CGGAGATCGG TTTCGGGGCC 
TGGGTCGTCG GCACCGACTG GTGGGGCGAC CGCAGTCGCG ACCAGGCCAT CGAGATGGTT 
CACCACGCCA TCGACCAGGG CGTCACCTAC TTCGACACCG GCGACGTGTA CGGCCACGGG 
GCGAGCGAGG AACTAATCGG CGAGGCCCTC GCGGAGTATC GCGAGGACGT GACGGTCTCG 
ACGAAGGTCG GCTACGACTT CTACAACAAC CCTCAGGCCG GCCACGGGGA ACTCCCCAAG 
CGGATCGACG GCGAGTGGAT CCGAGAGGCG CTTGACGACT CGCTGGAGCG GCTCGACATG 
GAGTACGTCG ATATGCTCAT GTTGCACAAC GCCAACGCCG ACGAGGTCGA CGCGGACGTG 
CTGGCGACGC TCGACGAGCT CCGAGAGGAG GGCAAAGTCG AGGCGATCGG CTGGGCGCTC 
GGCCCCTCGA TCGGCTGGCT GGCCGACGGC GACGCCGCCG TGCAAAACGA GTTCGACGCC 
CTCCAGACGG TCTTCAACAT GTTCGAGCAG GTGCCGGGCC AGCACTTTCT CGACACCATC 
CGAGAGCTGG ACGCCGACAC CTCCGTCGTC GCCCGCGTGC CCCACTCCTC GGGGCTGCTC 
AACGAGCAGG TCACGCCCGA CACCGAACTC GGCGAGGGCG ACCACCGCTC TCACCGCCCA 
ACCGAGTGGT ACGAGACCGG CTGGGAGAAA GTCGACAGCG TTCGGTTCCT GGAGCGCGCG 
GACGGCGCGA GCGGTGACGA ACCGCGAGGG GACCACGCCG ACGGCCGGCG AACGATGGCC 
CAGGCTGCCC TCCAGTGGCT GCTGTACCAC GACGAAGTCG CGAGCGTCAC GCCGACGTTC 
CGGACCGCCG CCGACATCGA CGAGTGGGCC GGCGCGCCGG CCACGCCGGC CCTGTCCGAC 
GCGGAGTACG AGCGCGTCCA GGAGCTGTAC GCGGACAACT TTGGCGTCGA CCGCGACGAC 
GGGATGGACC AGCTCCGGTC CTCGGTCGGC GGCGAGGACT TGGACGAGAC TGGGACGGCT 
CCGGCAGACG ACTGA

Protein sequence

MNERELGTSG VEVSEIGFGA WVVGTDWWGD RSRDQAIEMV HHAIDQGVTY FDTGDVYGHG 
ASEELIGEAL AEYREDVTVS TKVGYDFYNN PQAGHGELPK RIDGEWIREA LDDSLERLDM 
EYVDMLMLHN ANADEVDADV LATLDELREE GKVEAIGWAL GPSIGWLADG DAAVQNEFDA 
LQTVFNMFEQ VPGQHFLDTI RELDADTSVV ARVPHSSGLL NEQVTPDTEL GEGDHRSHRP 
TEWYETGWEK VDSVRFLERA DGASGDEPRG DHADGRRTMA QAALQWLLYH DEVASVTPTF 
RTAADIDEWA GAPATPALSD AEYERVQELY ADNFGVDRDD GMDQLRSSVG GEDLDETGTA 
PADD