Gene Hmuk_1933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1933
Symbol
ID	8411461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	1841021
End bp	1842187
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	67%
IMG OID	645020264
Product	ABC transporter, periplasmic binding protein, thiB subfamily
Protein accession	YP_003177753
Protein GI	257387980
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGAC GGAACTTCCT CACGCGAACC GGAGCGGGCC TCGCAAGTCT GACTGCGCTG 
TCGGGCTGTA CCGGTGACGG CGGCGACGGG ACCGAGTCGG CGAGTACCGA GAGCGCGACC 
GACACCGAGG TCACGGAGAG CGCGACCGAT ACCGAGAGCG TGACCGACGA GGGAACGACG 
ACCGGAACCG TCGAAGAACT GAGCGGGACG CTGTCGGTCG CGACCTACTC GTCGTTCGTC 
GGCGAAGACA CGGCCGGCAA CTGGCTCAAA TCCGAGTTCG AGTCCGAGCA TCCGGACGTG 
ACCGTCGAGT TCGAAACGCC CGAGAACGGG CTCAACCAGT ACATCCAGCG CAAGTCCGAG 
GGCGCGCCGA TCGACGCCGA TCTGTTCGTC GGGCTCAACA CGGGGGAACT CGTCCGGGCC 
GACGAGCAAC TCGACGAGGC GCTGTTCGCG ACTGCCAGTG ACCGCATCGA AGGGGCGGAC 
ACGGTCAAGC CGGAGCTCCA GTTCGATCCC GACGGACGAG TCGTGCCCTA CGACACCGGG 
TACATCAGCC TCGTCTACGA CGAGGGCGAG GTCGACGCGC CGGGCACCTT CGACGCCCTG 
CTCGAACCCG CCTACGAGGA CGCGCTGATC GCCCAGAACG CCCAGCAGTC CGACCCCGGT 
CGCGCGTTCC TGCTGTGGAC GATCTACAAC AAAGACCCGG ACGGCTATCT GGACTACTGG 
GAGGGGCTGG TCGACAACGG CGTCACGATC CTCTCGGACT GGGAGCCGGC GTACAACGCC 
TACTCGGATG AGGAGGCCCC GATGGTCGTC TCGTACTCGA CCGACCAGGT GTTCTACCAC 
GGCGAGGGCG TCGACATGTC GCGCCACCAG ATCGGCTTCC TGAACGATCA GGGCTACGCC 
AACCCCGAGG GGATGGCCCA GTTCGCCGAC AGCGACGACG CCGAACTGGC CCGGGCGTTC 
GCCTCGTTCG CACTGACAGC TCCGGCCCAG CGCGAGATCG CCACGCGAAA CGTCCAGTTC 
CCGGCCGTCG AGGGCGTCGA CCCCGGCGGC GACTTCGGCG AGTACGCGCT GGAGCCCCCC 
GAGCCGGTCA CCTTCACCTA CGACGAACTG TCGGGCAACG TGAGCGGCTG GATCGACGAG 
TGGGCCCGAC AGATCGCGAG CAACTAG

Protein sequence

MRRRNFLTRT GAGLASLTAL SGCTGDGGDG TESASTESAT DTEVTESATD TESVTDEGTT 
TGTVEELSGT LSVATYSSFV GEDTAGNWLK SEFESEHPDV TVEFETPENG LNQYIQRKSE 
GAPIDADLFV GLNTGELVRA DEQLDEALFA TASDRIEGAD TVKPELQFDP DGRVVPYDTG 
YISLVYDEGE VDAPGTFDAL LEPAYEDALI AQNAQQSDPG RAFLLWTIYN KDPDGYLDYW 
EGLVDNGVTI LSDWEPAYNA YSDEEAPMVV SYSTDQVFYH GEGVDMSRHQ IGFLNDQGYA 
NPEGMAQFAD SDDAELARAF ASFALTAPAQ REIATRNVQF PAVEGVDPGG DFGEYALEPP 
EPVTFTYDEL SGNVSGWIDE WARQIASN