Gene Hmuk_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2046
Symbol
ID	8411577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1947876
End bp	1948901
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	69%
IMG OID	645020380
Product	glycosyl transferase family 2
Protein accession	YP_003177866
Protein GI	257388093
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGCC GGGGGCAGGC CACGAGCGGG CACAGCAGCG ACACAGCGTC CGATCTTTCC 
CTCTCCGTGG TCGTCGTGAC CTACAACGAG GCCGATCGTA TCGAGGCGTG TCTCGATGCG 
ATCTTCGAGG CGTGTCGCCG GTTCGAACGT ACCGAAGTCG TCATGGTCGA TTCGCGCTCG 
ACCGACGAGA CCATCGCGCT GGCCGCCAAC TATCCGATCC GTGTCTACCG TCTCCCCGCG 
TCCACGGACC GCACGCCCGG TGCCGGTCGA TACGTCGGGA CACAGGTCAC GTCGGCTGAC 
CCCGTGCTGT TCGTCGACGG CGACATGATC GTCGAGCCCT CGTGGGTCGC GGCCGCCGCG 
GCGCGGCTCC GGTCCGAGCC CGCGGTCGCC GGCGTCGACG GCTGTCTCAA CGACGCCTCC 
GGACGGACCG AACGCCGCGT CGACACGCTT CGTGGCGTCG TACTGTACGA CCGGGCGATC 
CTGGCGTCGG TCGGCGGCTT CGACCCGCAC CTGCAGGCCC TCGAAGACGT GGAGCTGGGC 
TTCCGCCTCA GGAACGCGGG ATACCACCTG GTGCGGCTCC CGATCGTCGC CGCAACCCAC 
CCCTTCGGCG ACGGGCTACC AGAGCTGCGT CGCCGGTGGC GCAGCGGCTA CTACTTCGGC 
CGCGGGCAGG TCCTGCGCAA GTGGTCTCGA TCCCCGCGGA TGGTCGCGCG CGTGTGTCAC 
TACTCTCGAC TCTACGCGGT GATGGGCGGC TGGACGGCGC TCGGAATCTT CGCAACCGGT 
TCGCTGGGAC CGGTCGGGCT TCTGGCGTGG TGCTGCGTGA CGGCGGCGCT GGTCGGCGTC 
TGTCTCCGAC TCAAGGGGCG GACCTGGGTC GAAAACAAGT CGATATCGCT CGCTCCCGTC 
TGGGCGGGCG CACTCGTCGG CTTTCTCGGG CCGCACCCGC CGCCGTCTTC CTATCCGGTC 
GGACGGGTCG AGCTGATCGC GACGCCGACC GGGCGGAGTT CCGGAGCGGT CGGAGGGATT 
CGATGA

Protein sequence

MSCRGQATSG HSSDTASDLS LSVVVVTYNE ADRIEACLDA IFEACRRFER TEVVMVDSRS 
TDETIALAAN YPIRVYRLPA STDRTPGAGR YVGTQVTSAD PVLFVDGDMI VEPSWVAAAA 
ARLRSEPAVA GVDGCLNDAS GRTERRVDTL RGVVLYDRAI LASVGGFDPH LQALEDVELG 
FRLRNAGYHL VRLPIVAATH PFGDGLPELR RRWRSGYYFG RGQVLRKWSR SPRMVARVCH 
YSRLYAVMGG WTALGIFATG SLGPVGLLAW CCVTAALVGV CLRLKGRTWV ENKSISLAPV 
WAGALVGFLG PHPPPSSYPV GRVELIATPT GRSSGAVGGI R