Gene Hmuk_0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0212
Symbol
ID	8409710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	211268
End bp	212539
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	70%
IMG OID	645018537
Product	dihydroorotase
Protein accession	YP_003176056
Protein GI	257386283
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0857683
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATTC GGAACGCGAC GCTCGCGGAC GGACGGACTC GGGACGTGCG CGTCCGCGGA 
GAGACGATCG ACGCCGTGGA CGAGGATCTC GACCCGGCGG ACGAGGACAC CGTCGACGCG 
GCAGACAGAC TGCTCTTGCC CGGAGCGATC GACGCCCACG TCCACTTCCG CCAGCCCGGC 
TACGGCCACA AGGAGAGCTG GGCCAGCGGT TCGCGGTCGG CCGCGGCCGG CGGCGTCACG 
ACCGTCGTCG ACCAGCCCAA CACCGACCCG CCGACGGTCG ACGGGGCCGC CTTCGATCAG 
AAGGCCGAGC TGGCCGGCGA ATCACTCGTC GACTTCGGCA TCAACGGCGG CGTCACGGGC 
GAGTGGGAGC CCGCGGAACT ACTTGACCGG CCCCTGTTCG CACTCGGCGA GGTCTTCCTC 
GCGGACTCGA CCGGCGACAT GGGGATCGAC GCCGACCTGT TCGAGGACGC ACTGGTCGCG 
GCGGCCCAGC GGGACGTGAC CGTCACCGTC CACGCCGAAG ACGCCTCGCT GTTCAATCGG 
GCGGCGAGAG ATCGCGACGA CGCCGACGCC TGGAGCGCGT TCCGCACCGC CCGCGCGGAA 
GCCGCCGCCG TCGAGCGAGC CTGCGAGGTC GCGGCCGAAC ACGACGCCCG GATCCACATT 
GCACACACCT CCACACCCGA GGGGATCGAC ACCGCCAGCG ACGCCGGGAT GACGACCGAG 
GTCACGCCCC ATCACCTCCT GCTCTCGCGG TCGGACCTCG ACGAGTTGGG CACGCACGGC 
CGGATGAACC CGCCGCTGCG CAGCGAGAAA CGCCGCCGAG AGGTGTACGA CCGCGTCGTC 
GACGGCACCG TCGACATGAT CGCGACCGAC CACGCGCCCC ACACCCGCGA AGAGAAGGAC 
GCCTCGATCT GGGACGCCCC CTCCGGGGTG CCCGGCGTCG AGACGATGCT CCCGCTCTTG 
CTGGCCGAGG CCCGGACCGG CGATCTGACC TACGAACGGG TCCGAGATCT CGTCGCCGCG 
AACCCCGCCG ACGTGTTCGA CCTGCCGGAG AAGGGCCGGA TCGCCGAGGG CAACGACGCC 
GACCTCGTGC TGGTCGACAC CGACGACGTG CGCGAGATCA CCGGCGACGG GCTCCACTCG 
AACTGCGGGT GGACTCCCTT CGAGGGGTTC GAGGGCGTCT TCCCGAAGTG GACGATGGTC 
CGTGGCACGG TCGTCTACGA CCGGTCTGAC GACGAATTCA CCGATCAGCA GGGCGAGAAC 
GTTCGAGCCT GA

Protein sequence

MLIRNATLAD GRTRDVRVRG ETIDAVDEDL DPADEDTVDA ADRLLLPGAI DAHVHFRQPG 
YGHKESWASG SRSAAAGGVT TVVDQPNTDP PTVDGAAFDQ KAELAGESLV DFGINGGVTG 
EWEPAELLDR PLFALGEVFL ADSTGDMGID ADLFEDALVA AAQRDVTVTV HAEDASLFNR 
AARDRDDADA WSAFRTARAE AAAVERACEV AAEHDARIHI AHTSTPEGID TASDAGMTTE 
VTPHHLLLSR SDLDELGTHG RMNPPLRSEK RRREVYDRVV DGTVDMIATD HAPHTREEKD 
ASIWDAPSGV PGVETMLPLL LAEARTGDLT YERVRDLVAA NPADVFDLPE KGRIAEGNDA 
DLVLVDTDDV REITGDGLHS NCGWTPFEGF EGVFPKWTMV RGTVVYDRSD DEFTDQQGEN 
VRA