Gene Hmuk_0902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0902
Symbol
ID	8410417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	867091
End bp	868146
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	70%
IMG OID	645019236
Product	Squalene/phytoene synthase
Protein accession	YP_003176738
Protein GI	257386965
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.883554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.674566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAG TGCCGCAGCA GGCGACGCTG GCTGACGATC GGACCTGGGC GTTCGAGGCC 
GTCCAGTCGG TCTCCCGGAC GTTCGCGCTG AGTGTCGAGT TGCTGGACGA GCCGATGACG 
GAGTGGGTCT GTACCGGCTA TCTCCTCTGC CGGACCGCAG ACACGATCGA GGACGAACCG 
ACGATCCCGA TGGGCCGACG CGCCGAGCTC TTAGAGACCT TCGACGCGAT GCTGGCCGAA 
GAGTCGGAGA CGACCGTCGA GGACTTTCTC TCGGCCGTCG AGCCGGAGAC GCCGGCCGAC 
GGGGGCGACG ACTGGGCCGT CCTCGGTCAG ACCGACCGGA TCGTCCGCCT CTGGCGGTCG 
TTTCCCGACC CCGTCCAGGA CGGGATGCGC TCGATCACCC GCGAGATGGC GACGGGCATG 
GCGGACATCC TGCGCCGCCA CGAGGACAGC GGCGGCCTCC GTCTGGAGAC GCTCGACGAG 
CTCGAAGAGT ACTGCTGGTA CGTCGCCGGC ACCGTCGGCC AGCTGTTCAT GAAGCTCCAG 
ACCGCCCGAG CCGACCCCGA CGACCCCACG CCGGACCCCG AAGACGCCCG CGCGTTCGCA 
CTCCTGCTCC AGCTCGTCAA CATCGCCAAG GACGTTCGCG CCGACTGGGA CGAAGAGCAC 
AACGTCTACC TGCCCGGCGA GTGGCTCGCC GAGGAAGAAC TCGACCACGA GGCCGTCGCC 
GAGCCCGAGC ACTCGACCGC GGTCGCCCGC GTCGTCGGCC GGGTCGTCGA CCAGGCCGCC 
GACTACGCAC ACGGTGCCCA GCGGTACCTC TCGACGGTCC CGGAGGGAGA CAACGGCGGT 
CTCCTGGAGG CGACGGCGCT GCCCTACCTG CTGGCACTCG GGACGATCCG CGAACTCCGC 
GAACGGACCG TCGACGCCGT CGAACAGCCC GACGCGGTCA AGCTCGAACG CGAGGAGGTC 
GAGGCGCTGT TCGCCGAGGC CGAGGACGGC TTCACCCGCG ACCAGGTCCG CGATCTCGCA 
GCCACGGTGC GAGCCGGTCC GTACCACGAG CAGTAG

Protein sequence

MTGVPQQATL ADDRTWAFEA VQSVSRTFAL SVELLDEPMT EWVCTGYLLC RTADTIEDEP 
TIPMGRRAEL LETFDAMLAE ESETTVEDFL SAVEPETPAD GGDDWAVLGQ TDRIVRLWRS 
FPDPVQDGMR SITREMATGM ADILRRHEDS GGLRLETLDE LEEYCWYVAG TVGQLFMKLQ 
TARADPDDPT PDPEDARAFA LLLQLVNIAK DVRADWDEEH NVYLPGEWLA EEELDHEAVA 
EPEHSTAVAR VVGRVVDQAA DYAHGAQRYL STVPEGDNGG LLEATALPYL LALGTIRELR 
ERTVDAVEQP DAVKLEREEV EALFAEAEDG FTRDQVRDLA ATVRAGPYHE Q