Gene Hmuk_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2106
Symbol
ID	8411644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2010412
End bp	2012196
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	73%
IMG OID	645020447
Product	hypothetical protein
Protein accession	YP_003177926
Protein GI	257388153
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.057671
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCCTA CGCACCGCAC CGCCGCCCGG ACGAACGCCC CGACCCGACA GCTCCTGATC 
GTGGCGACGT GTGTCGTCGG CCTCCTCGTC GCCGCAGCCG CCATGCCAGC CACGGCACCA 
CAGCCGACGC CCCCGGAGTT CCTGAGCGGG GAGTCGGACT GCCAGATCCT CTTCTCCGAG 
GATCCGGTCG CCGGACACGA ACTCACCACG ACGGTCCTGT ACGACGAGGA GCCGGTGTCG 
GACTCACCGG TGTGGTTCAA CGGCGAACGC GTCGGCCGGA CCGACGAGGA CGGACGGGTC 
GTCGGCACCG TCCCCTACGA GCAGACCCTG CAGGTCCGGG TTGAACTGCC CGGCGGGGGC 
AGCTGTGAGG CCAGCATCGA CACCGGCGAC TCGGACGCGC CGCTGAAGAC CGTCGACCGA 
TCCGGCCTCG GTGTCGCCGC CCTCGACGGC GTGGCCCAGC AACAGGCTCA GAACGGGTCG 
GGCGCGTACC CGGTCCGTGG CCGGATCGAT CTCTCGGTCG ACGAACAGCC CTACCCCGGC 
GAGACGACGA CGCTGCGGGC GACGATCCAG GGCAACCCCG TGGCCGACGC GACGGTGTCG 
GTCGACGGAC GGACGATCGG ACGGACCGAC GCAGACGGCA CGATCGAGAT TCGCGCGCCG 
ATCGAGGGCG ACCGGACGCT CACCGTCCAC GTCGAACGGG GGGCCTTCGA ACGCGAGACC 
GAGATCGTCG TCCTCCGCCT CGACGCGACG ATACGGACCG ACGCACTGCT CGCGCTGCCG 
GGGCAGAACG CGACGGTCGT CGCCCGGCTC GGCGACCGCC CGGCGGTCAA CGCCACGGCG 
CTGGTCGGCG GCGAGCGACT GGGTCGAACG GACGCGGACG GCCACGTCGA GATGACGCTT 
CCGGCCGACC CGACGGCACG GCTCACCGTC GCGACGGCCG ATCAGGTGGC CACCACGCCG 
GTCCTGTTGG CGTTCGCGCC GACGATCCTG CTGACCGTCC TCGCCGTCCT CGCGCTCGTC 
GGCGTGCCGG CGGCCGGCTA CTCGATCGCC GGTCGTCGCG GTGTGGCGAT CGGCTCCGGC 
GTCGCCGTCA GCGTCCTGGC GCTCGCGTAC GTGTTTCTCC GCTTTGGCCG CACGATCGCA 
CTGCTGGGGT CGCTGGCGCT GCTGGCGGTC GTCGGACTCG TCGCCTTCCT CCGGAGCGAC 
TACAGCGCGG TCGAGGCGGC CCGAGCGACC GCCGGCTGGT TCCGCCGTCT CGGCCGCCGA 
CTGGCCTCCG ACGGCCTGTG GCTGTCCGGG CGACTCGAAG CTGCCGTCGG GAGCCTCGAA 
CGCCGTCTCC GGCGTCTGTG GGACCGACTG ATGGGTCCAG ACGCGACGCC GCTCGCGGAC 
GCCGGCCGCT GGCTCACGTC GCTTCCCGCC CGCCTGCTCG CGCTCGTCCG CGCTCTCGCC 
CGCGGGCCGA GCTGGCTAGG TGCCGACGAG AGCGACCGCG ACGACCTCGC GGGCGAATCC 
GGAGACGCGG ACGACGAGAC GACGCTCTCG CGGCGCGCAC AGTTCCGCCG CGTGTGGCGT 
GCGTTCGCCG GTCGGGTCGC CCCCGAGACG TGGCCCCGGC GCACGGCCGG CGAGGTCTCC 
CGTCGGGCGA TCGATCGCGG CCTCTCGCCC GAGCCGGTCC GCGAACTGAC CGACACGTTC 
CGGGCCGTCG AGTACGGCGA CGAGTCGCTC ACCGACGGAC AGGTAGCGCG GGCTCGCGCG 
GCCCTGGAGG AGATCCGCGA CGACTCCGAG GGGGGGTCGG CGTGA

Protein sequence

MVPTHRTAAR TNAPTRQLLI VATCVVGLLV AAAAMPATAP QPTPPEFLSG ESDCQILFSE 
DPVAGHELTT TVLYDEEPVS DSPVWFNGER VGRTDEDGRV VGTVPYEQTL QVRVELPGGG 
SCEASIDTGD SDAPLKTVDR SGLGVAALDG VAQQQAQNGS GAYPVRGRID LSVDEQPYPG 
ETTTLRATIQ GNPVADATVS VDGRTIGRTD ADGTIEIRAP IEGDRTLTVH VERGAFERET 
EIVVLRLDAT IRTDALLALP GQNATVVARL GDRPAVNATA LVGGERLGRT DADGHVEMTL 
PADPTARLTV ATADQVATTP VLLAFAPTIL LTVLAVLALV GVPAAGYSIA GRRGVAIGSG 
VAVSVLALAY VFLRFGRTIA LLGSLALLAV VGLVAFLRSD YSAVEAARAT AGWFRRLGRR 
LASDGLWLSG RLEAAVGSLE RRLRRLWDRL MGPDATPLAD AGRWLTSLPA RLLALVRALA 
RGPSWLGADE SDRDDLAGES GDADDETTLS RRAQFRRVWR AFAGRVAPET WPRRTAGEVS 
RRAIDRGLSP EPVRELTDTF RAVEYGDESL TDGQVARARA ALEEIRDDSE GGSA