Gene Hmuk_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1920
Symbol
ID	8411447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1829517
End bp	1830572
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	645020250
Product	NADH dehydrogenase (quinone)
Protein accession	YP_003177740
Protein GI	257387967
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.179258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCCG AGACGCCGCT TCCCGACACG CTCGCGAACC TGCTCGGACT GGACCCGTCG 
AACCCGCTGG TCCTGTTCGT GATGGCGGTC GTCGCGTCCG GTGTGATCGC GTCGGGACTG 
CTCGCCCTGG TCGCCGTCTC GGGGATCTGG GGCAAGCGGA AGATCACGGC AGCGTTCACC 
GACCGGATCG CTGTCAACCG ACACGGGCCG GCGGGCATCC TGATCATCCC GGCAGACGCG 
CTCCGGCTCC TCTCGAAGGA ACTGATCGTT CCGGAGGGCG TCGACCGTCC GGCCTGGGAC 
CTGGGGCCGC TCATCATGGT CTTCTCGGCG CTGGCCGGCT TCGCCGTCAT CCCCATGGGG 
AACGGCATCC AGATCGCCGA CCCGGAGACG GGACTGGCCT ACGTGTTCGC GATGGCGTCT 
GTCGCCTCGC TCGGCCTCGT GATGGCCGGC TACTCGTCGA ACAACAAGTA CTCGTTCCTC 
GGGGGACTGC GCGCGGTCGC ACAGAACCTC GCCTACGAGA TTCCGCTGAT CCTGACGGGG 
ATGTCCGTGG CGCTTTTCGC CGGGACGCTC CGCCTGAGCG AGATCGTCGC GGCCCAGAGC 
ACGACGCTGT TCAGCCTCGG CGGCCTCGCG ATCCCGTCGT GGTACGCGTT CGTCAACCCC 
TTCGCGTTCG TGCTGTTCAT GGTCGCGAAC CTCGCGGAGG TCGGACGGAA CCCGTTCGAC 
ATTCCCGAAG CGCCGACCGA GATCGTCGCC GGGTGGCAGA CCGAGTACTC CTCGGTGTAC 
TTCGTGCTCG CGTACCTCTC GGAGTTCATC CACATCTTCC TCGGCGGTGC GATCATCGCG 
ACGATCTTCC TGGGCGGTCC GGCCGGCCCG GTGTTGCCGG GCATCGTCTG GTTCCTGATC 
AAGATCGTCG GGATCTACCT GTTCACTCAG TGGGCGCGTT CCGCGATCCC ACGGGTCCGG 
ATCGACCAGC TCATCGAGAT CGGCTGGAAG GGCCTGCTCG TGCTGGCCTT CGCGAACCTG 
CTCCTGACGG CCGGGATCGT CGGGGTGATC GCCTGA

Protein sequence

MQSETPLPDT LANLLGLDPS NPLVLFVMAV VASGVIASGL LALVAVSGIW GKRKITAAFT 
DRIAVNRHGP AGILIIPADA LRLLSKELIV PEGVDRPAWD LGPLIMVFSA LAGFAVIPMG 
NGIQIADPET GLAYVFAMAS VASLGLVMAG YSSNNKYSFL GGLRAVAQNL AYEIPLILTG 
MSVALFAGTL RLSEIVAAQS TTLFSLGGLA IPSWYAFVNP FAFVLFMVAN LAEVGRNPFD 
IPEAPTEIVA GWQTEYSSVY FVLAYLSEFI HIFLGGAIIA TIFLGGPAGP VLPGIVWFLI 
KIVGIYLFTQ WARSAIPRVR IDQLIEIGWK GLLVLAFANL LLTAGIVGVI A