Gene Hmuk_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0937
Symbol
ID	8410453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	900069
End bp	901388
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	68%
IMG OID	645019272
Product	major facilitator superfamily MFS_1
Protein accession	YP_003176773
Protein GI	257387000
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.725221
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCC GCTCGCGGCG TGGGCTCGCG ATCGTCTTCG CCGTCGTCTT TCTGGACCTG 
CTGGGGTTCG GGATCATCAT CCCGATCCTG CCCTACTACA CGCGCACGTT CCCCGGCGGT 
ACGGAGTTCG TCATCGGACT GCTGGCGGCC TCGTACTCGC TCATGCAGTT CGTCTTCGCT 
CCACTGCTGG GCTCGCTCTC GGACCGGATC GGCCGTCGCC CCGTCATCGT GGTGTCGCTC 
GGCGGCTCGG TGATCGCCTG GACCGTCTTC GGGCTGGCCG ACGCGCTGTG GCTGTTGTTC 
CTCTCACGCA TGCTCGCAGG TGCGATGGGT GGGAACCTCT CGACGGCACA GGCCTACGTC 
GCCGACGTGA CCCCGCGAGA GGAGCGAGCG AAGTCACTGG GCCTGCTCGG GGCCGCGTTC 
GGACTGGGAT TTATCTTCGG TCCCGGAATC GGTGCAGTGT TGAGTTTCGA CGGCGTCGTC 
GCCGCCGTCG ACGGCCTCGT CCCGGTCGTG GCCATCACCC GCTTCTCGCT GCCGAGTTTC 
GCCGCCGCCG CGGCGAGTCT CTGCGGCGTC GTCGTCACGC TACTGTTCCT GCCGGAGTCG 
CTGCCGGCCC CCGCCCGCGG CGACGAGACC ACGCGGCGGC CGTCCCAGAT CGCGCAGTTG 
GTGACGGCCG TCCGGACGAC CGGGTTGCGA GAGCTGCTCG CCGCGTTCTT CCTCGTCTCC 
TTCGCGTTCT CGGGCGTCCA GATCATGTTC ATTCCGTTCG TCGCCGACGT GTACGGCTAC 
ACGGCGAGTC AGAGCGCGCT CTTGCTCACC TATATCGGCG TGCTGTCGGT CGTCGTCCAG 
GGCGTGTTGA TCGGGCGACT GACGGCGCGA TACGCCACAG TGTCGCTGAC GGTCGGTGGG 
ACCGCGGTGC TCGCAGTGGG CGTCGGGCTC TTGCCGTTCA CGAACTGGCT GGGAGCGAGC 
GTCTTCGATC TGACCGGCGT CGCACCGTTT CTCACCGGCG AGTTGCTGGC ACTGCTGGCG 
GTGCTGACGC TGCTGCCGCT CGGCAACGGC GTGTTGTCGG TGACGCTGAC GACGATCGTC 
TCCCAGCGAG CCTCCGCCGC GACCCAGGGG AGCGCGTTCG GCCTGACACA GGGTGCCGGC 
AGCCTCGCGC GGACGGTCGG GCCGATCGTG ATGGGCGGGC TCTACACCGT GGTGGGTTAC 
TGGTCGCCGT TCGTCGTCGG CGCGGTGTTG CTCGTCCCCG TCGGAGTGTT GGTCCTCCGT 
CTCGGGAACG CTCCGGAGCC GCCCGAGCCG CGGCCTGTCG ATCCGGGCCA CGTTCGATGA

Protein sequence

MATRSRRGLA IVFAVVFLDL LGFGIIIPIL PYYTRTFPGG TEFVIGLLAA SYSLMQFVFA 
PLLGSLSDRI GRRPVIVVSL GGSVIAWTVF GLADALWLLF LSRMLAGAMG GNLSTAQAYV 
ADVTPREERA KSLGLLGAAF GLGFIFGPGI GAVLSFDGVV AAVDGLVPVV AITRFSLPSF 
AAAAASLCGV VVTLLFLPES LPAPARGDET TRRPSQIAQL VTAVRTTGLR ELLAAFFLVS 
FAFSGVQIMF IPFVADVYGY TASQSALLLT YIGVLSVVVQ GVLIGRLTAR YATVSLTVGG 
TAVLAVGVGL LPFTNWLGAS VFDLTGVAPF LTGELLALLA VLTLLPLGNG VLSVTLTTIV 
SQRASAATQG SAFGLTQGAG SLARTVGPIV MGGLYTVVGY WSPFVVGAVL LVPVGVLVLR 
LGNAPEPPEP RPVDPGHVR