Gene Hmuk_3416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3416
Symbol
ID	8409494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013201
Strand	-
Start bp	220610
End bp	221812
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	645018337
Product	glycosyl hydrolase family 88
Protein accession	YP_003175858
Protein GI	257373084
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGAA GTCCTCAGGC GCTCGCGGCC GCAGTGACCG AACCGGCGCT TCCCGACCGA 
TACTTCGAGC GGCCCGAGCG AAGCCAGGAA CAGTTAGAAC GGGCGTTGAC GGACGCGATC 
GAGCGGATCG GCGAGAACCT CGACCGGTAC TACGACCGGT TCCCGACGGC TTCGAGCGAC 
GACCTCGTCT ACGGGTCGAC CGACAACACC GACGGGTGGA CGACCGCCTT CTGGACCGGA 
CTGTGCTGGC TCGCCTACGA CGTGACCGGC CAGCGGCGGT TCAGAGACGC CGCCGAGGCA 
CAACTGGAGA CGTTCGCGCA CCGCCTCGAC GACGGCCTCG TCGAGACGCA CGATCTGGGC 
TTTCTGTACA CGCTGTCGGC GGTCGCCGGC TACCGGCTCA CCGACGAGGA GCGGTATCGA 
TCGATCGCGC TCCGCGGGGC CGATCTGCTC ACCGACCGCT ACTGGCAGGC TCCCGGGCTC 
CTCCAGGCCT GGGGGAGCAT GGACGACGAA GACGACGAGA ACCGCGGGCG GATGATCGTC 
GACACGATGA TGAACCTCCC GCTGCTGTTG TGGGCCAGCG AGGTCACGGA AGAGCCGCGG 
TACCGAGCTA TCGCGGCCTC CCACGCCCGC ACGAACGCCG CCCACATCGT CCGCCCGGAC 
GCCTCGACGT TTCACACGTT CCGGTGTACC GTCGATGACG GGACGCCACT GGGTGGTGAG 
ACGGCCCAGG GGTACGACGA CGACTCCTGC TGGTCGCGCG GGCAGACGTG GGCGATCTAC 
GGCTACGCGG TCGCCGCCGA CTACCTCGAC ACCGCTGCCT ACGCGGGGCT CTCGGCCAAG 
GTCGCGAACT ACTACCTCTC GCACGTCGAG GACGACCACG TCCCGCTGTG GGACTTCGAC 
GCCCCGACTG ACCCGGCGAT CCGAGACAGC TCGGCCGCCG CCGTCGCCGC CTGCGGGCTG 
GACGAACTCT CCCGACAGCT GCCAAGCGGC GACGAGCGCG TCCCGGCCTA CCGCAACGCC 
TCGCTGGCGA CGCTGGCCAG TCTCACCGAG CACTACACCG CGGGCGCGGA CTCGAACGGA 
CTCCTGACCG ACGGTGCGTA CCACCCGTCG GACGGCGACT ACGGCGAGTG TTGCATCTGG 
GGCGACTACT TCTACGTCGA GGCGCTCGTC CGGGCGACCC GACACTACGA CCGGTTCTGG 
TAA

Protein sequence

MSRSPQALAA AVTEPALPDR YFERPERSQE QLERALTDAI ERIGENLDRY YDRFPTASSD 
DLVYGSTDNT DGWTTAFWTG LCWLAYDVTG QRRFRDAAEA QLETFAHRLD DGLVETHDLG 
FLYTLSAVAG YRLTDEERYR SIALRGADLL TDRYWQAPGL LQAWGSMDDE DDENRGRMIV 
DTMMNLPLLL WASEVTEEPR YRAIAASHAR TNAAHIVRPD ASTFHTFRCT VDDGTPLGGE 
TAQGYDDDSC WSRGQTWAIY GYAVAADYLD TAAYAGLSAK VANYYLSHVE DDHVPLWDFD 
APTDPAIRDS SAAAVAACGL DELSRQLPSG DERVPAYRNA SLATLASLTE HYTAGADSNG 
LLTDGAYHPS DGDYGECCIW GDYFYVEALV RATRHYDRFW