Gene Hmuk_0201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0201
Symbol
ID	8409699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	196820
End bp	198277
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	69%
IMG OID	645018526
Product	hypothetical protein
Protein accession	YP_003176045
Protein GI	257386272
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00798209
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCGCG CCGCCCTGCT CGCTGCGCTG CTCGTTCTTG CCGGCTGTCA GGCTCCGTCG 
GCCGGCCCGT CGGCGGCGTC CCCCGTACAC GAGACGACGG GGACCGACGC CCCCGAGCCG 
ACGGCCACGC CCACATCTGT CGACACTGAC GACGGCCCGC CGGATCCCGA GACGGATCGG 
ATCGGCTGGG AGAACGGATA CTGGCACAAC GAATCGCTGG ACGTGACCAA CAGCGACGGC 
CTCAACGAGA GCGAACGCGA GGCCGTCGTC GCCCGCTCGA TGGCCCGCGT CGAGTCGGTC 
CGAGAACGCG AGTTCGACGA GACGGTCCCG GTCAGCGTGA TCGACCGGTC GACGTACCGG 
AACCGCTCTA CCCCCGCGTC GAACGCGACG AGCGCGCGCT TCGACAACGG CAAGTTCGAG 
GCTTTGTTCC TGATCGGCGA GGACAGGGAC GCGCTGGCGG CACAGAACGC CGCGCTGAGC 
CAGAGCGTGC TCGGCTACTA CAGTCCGGCC CGCGACGAGA TCGTCATCGT CGCCGACAGC 
GAGACGCCAC AGCTCGACGG CGAGGCGACG CTCGCCCACG AACTGGTCCA CGCCTTGCAA 
GACCAGCAGT TCGACCTGAC CAACGGGACC GTGACGACCC GCGACGCCTA TCAGGGCCGC 
AACGGGATCG TCGAGGGCGA CGCCTCCTTC GTCGAGCGGC GCTACACCGC CAACTGCGGC 
GCCACCTGGT CCTGTCTCGA CTCGGCCGAC AGCACGCAAA GCGGCGGCGG TGACAGTCAC 
TTCGGGCTGA ACTTCCTCCA GTTCTTCCCC TACAGCGACG GTCCCGGCTT CGTCGAGCAT 
CGCTACGAGG CCGGCGGCTG GGCGGCCGTC GACGCCGCGT TCGCGGACCG GCCCGACGGT 
GCGACGGAAG TGATCTACCC CGAACAGTAC CCCGAGTGGG AGCCGGCGAC CGTCTCCCTG 
CCCGACCGCA GTAACGACGA GTGGGAGCGG GTCCGACCGC CGGGACGCGC CGACTACGCC 
GTCGTCGGCC AGTCCGCCAT CGCGGCGTCG CTCGCCTACA CCGTTACCGA CGACTACGAA 
GACGCCAGCG TGGTGCGGGC CCGCGACGTG ATCAACTTCG AGGCCGACGG CAAAGTCGAC 
GGGGACGATC CGTACAACTA CGACGTGCCG GCCGCCCGCG GCTGGGCCGG CGGCAAACTG 
TTCGTCTACG AGAACGGCGA GCGGTCGGGC TACGTCTGGC GGACCCGCTG GACCAACGAG 
AGCGAGGCGG CCGAGTTCGC AAGCACCTGG AGCGCGGTCG TCCGCCACTG GGGCGGCGAG 
GAAACCGAGG AGAACGTCTG GACGATCGGC GAGGACAGTC CCTTCACCGA CGCCGTCAGG 
ATCGAACGCT CCGGCGCGAC GGTGACGGTC GTCGACGCGC CCGACGCGGC GGCATTGGAG 
GCGGTACACG ATGCGTAG

Protein sequence

MYRAALLAAL LVLAGCQAPS AGPSAASPVH ETTGTDAPEP TATPTSVDTD DGPPDPETDR 
IGWENGYWHN ESLDVTNSDG LNESEREAVV ARSMARVESV REREFDETVP VSVIDRSTYR 
NRSTPASNAT SARFDNGKFE ALFLIGEDRD ALAAQNAALS QSVLGYYSPA RDEIVIVADS 
ETPQLDGEAT LAHELVHALQ DQQFDLTNGT VTTRDAYQGR NGIVEGDASF VERRYTANCG 
ATWSCLDSAD STQSGGGDSH FGLNFLQFFP YSDGPGFVEH RYEAGGWAAV DAAFADRPDG 
ATEVIYPEQY PEWEPATVSL PDRSNDEWER VRPPGRADYA VVGQSAIAAS LAYTVTDDYE 
DASVVRARDV INFEADGKVD GDDPYNYDVP AARGWAGGKL FVYENGERSG YVWRTRWTNE 
SEAAEFASTW SAVVRHWGGE ETEENVWTIG EDSPFTDAVR IERSGATVTV VDAPDAAALE 
AVHDA