Gene Hmuk_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1997
Symbol
ID	8411526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1901801
End bp	1902880
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	67%
IMG OID	645020329
Product	glycosyl transferase group 1
Protein accession	YP_003177817
Protein GI	257388044
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.723795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0390531
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCACGC TGAACTACCT GGAGGTCGCG GGCTGGCTGG ACCGCAGCGG AATCGGTACG 
TCGGTCGAAC ACCAGCGAGC GGCGCTCGCC GACAGAGACG TCGAGGTCGT CACCTCGCCG 
TGGGAGGGCG GTCATCCGGT CGACGCCGTC CGGTCGAAGC TCACCGGCGG GCGCGCGTTC 
ACCGACGTGG ACCTCGTCCA CTGCAACATG ATCGGCCCGG GAACGGCCGC GACCATCAAG 
CACGCCCAGC GGACCGACAC GCCGGTAATC TGCCACGCAC ACGTCACTCG CGAGGACTTC 
CGAGACAGTT TCCGCGGGGC CAACGTCGTC GCCCCGGCCC TGGGGAGGTA CCTCAAGTGG 
TTCTACTCGC AGGCCGACCT CGTGCTGTGT CCCAGCGAGT ACACGAGAGG GGTGTTGCAG 
TCGTATCCGA TCGACGCGCC GATCCGGCCG ATCACGAACG GGATCGACCT CGACCGGCTG 
ACGGGGTACG AGGAGTTCCG CGAGGAGTAC CGCGAGCGCT ACGGCATCGA GGGGATGGGG 
ATCTTCGCCG TCGGCAACGT CTTCGAGCGC AAGGGGCTCT CTACCTTCTG TAGGGTCGCC 
CGGCGGACCG ACTACGACTT CACCTGGTTT GGCACCTACG AGACCGGACC GAGCGCGTCC 
GCGACGGTGC GCAAGTGGAC CGGTGATCCG CCGGACAACG TCACGTTCTC GGGGTGGGTC 
GACGACATCC GCGGGGCCTA CGGGGCCGGC GACGTGTTCA TGTTCCCCGC GAAGGTCGAG 
AACCAGGGCA TCGTCGTGCT CGAAGCGATG GCCTGCGGGA AAGCCTGTGT GATTTCGGAC 
ATCCCCGCCT TCTCGGAGTA CTACGAGGAC GGCCACGACT GCCTGATCTG CTCGTCCGAG 
CGGGAGTTCG TCGACGCGCT CGAACGGCTG GAAGCGAATC CCGATCTCCG GGAACGGCTG 
GGCGAGAACG CGAAAGCGAC CGCTCGCGAA CACGGACTCG ACCGGGTCGG CGAACAGCTG 
ACGGACATCT ACGAACGGGT CCTCGACGGG GACGTGCCAG AGGCTGTCGG CGAGAGATAG

Protein sequence

MRTLNYLEVA GWLDRSGIGT SVEHQRAALA DRDVEVVTSP WEGGHPVDAV RSKLTGGRAF 
TDVDLVHCNM IGPGTAATIK HAQRTDTPVI CHAHVTREDF RDSFRGANVV APALGRYLKW 
FYSQADLVLC PSEYTRGVLQ SYPIDAPIRP ITNGIDLDRL TGYEEFREEY RERYGIEGMG 
IFAVGNVFER KGLSTFCRVA RRTDYDFTWF GTYETGPSAS ATVRKWTGDP PDNVTFSGWV 
DDIRGAYGAG DVFMFPAKVE NQGIVVLEAM ACGKACVISD IPAFSEYYED GHDCLICSSE 
REFVDALERL EANPDLRERL GENAKATARE HGLDRVGEQL TDIYERVLDG DVPEAVGER