Gene Hmuk_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3049
Symbol
ID	8412602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2935159
End bp	2936328
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	66%
IMG OID	645021396
Product	phosphoesterase RecJ domain protein
Protein accession	YP_003178861
Protein GI	257389088
COG category	[R] General function prediction only
COG ID	[COG0618] Exopolyphosphatase-related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.1164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCT GGCAAGTGGG TGGCCTCCAG CGAGTCGTCG ATAGCGTCAC CGTGTTCGCG 
CGTGAATCGC CGCTGGTGGC CGCGCTCGTG GTCGTCGGGA TCCTCGTCTT TCTCGTCGGG 
GTTCGCCTCG CGATCGACAG ACTCCGCCGG TCGCCGGCCG AACGCTTCCA GCGACTGCTG 
GCGTCGACCG ACGAGGTCGC CGTGTTGATG CATCCGAATC CCGATCCGGA CGCGATGTCG 
AGTGCGCTGG CCGTCGACAG GCTGGCGACG CAGGCCGGTT CGTCGCCGAC GCTGTACTAC 
CCCGGACAGA TTCGCCATCA GGAAAACCGC GCGTTTCAGA CCGTTCTGGA TCTGGACTTC 
GATCGCATCG AGAAGGCCGG ACAGCTACAA GAGAGCGAGG TCGTCCTGGT CGATCACAAC 
GAGGCGCGTG GGTTCCCCGG CGCGGAGAGC ATCGATCCGA TCGCCGTGAT CGACCACCAT 
CCCGGCGGCG GCGAGGGGTC GGAGCTGTCC GACGTTCGCA CCGGCTACGG TGCCTGTGCG 
ACGATCTTCG CCGAGTACTT CGAGACTCTC GACTGGGAAC TGGCCGACGG CGACGCGACG 
GCCGACGACA ACCAGATCGA CCAACAGGTC GCGACCGGGC TGCTATACGG CATCCAGTCA 
GACACGAAAC AGCTCACGAA GGGGTGTTCG TCCGCGGAGT TCTCTGCGGC CGAGTACCTC 
TACGACGGGA TCGACGAAGA CCTGCTCGAC AGAATCGCGA ACCCACAGGT CGACGCCGAG 
GTCCTGGACG TGAAAGCCCG TGCGATCACC GACCGCCAGA TCAAGAACGC CTTCGCGATC 
AGCGACGTGG GCGCGGTCTC GAACGTGGAC GCGATTCCAC AGGCTGCCGA CGAACTGCTC 
CGACTGGAGG GCGTGACGGC GGTCGTCGTG ATGGGGCGCA AAGAGGACAC GCTGCACCTC 
TCCGGGCGCT CGCGCGACGA CCGCGTCCAC ATGGGTAACG TCCTCCAGAC GGTCGTCGAC 
GACATTCCGA TGGGGTCGGC GGGCGGCCAC GCCCGGATGG GCGGGGGCCA GCTCTCGATC 
GATCACATGA ACGGGATCGG ACCGGGAAGC GGCGTCGCGA TGACCGACTT CAAGGGGCAC 
CTGTTCGACG CGATGGCCGG CGACATCTGA

Protein sequence

MPIWQVGGLQ RVVDSVTVFA RESPLVAALV VVGILVFLVG VRLAIDRLRR SPAERFQRLL 
ASTDEVAVLM HPNPDPDAMS SALAVDRLAT QAGSSPTLYY PGQIRHQENR AFQTVLDLDF 
DRIEKAGQLQ ESEVVLVDHN EARGFPGAES IDPIAVIDHH PGGGEGSELS DVRTGYGACA 
TIFAEYFETL DWELADGDAT ADDNQIDQQV ATGLLYGIQS DTKQLTKGCS SAEFSAAEYL 
YDGIDEDLLD RIANPQVDAE VLDVKARAIT DRQIKNAFAI SDVGAVSNVD AIPQAADELL 
RLEGVTAVVV MGRKEDTLHL SGRSRDDRVH MGNVLQTVVD DIPMGSAGGH ARMGGGQLSI 
DHMNGIGPGS GVAMTDFKGH LFDAMAGDI