Gene Hmuk_3161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3161
Symbol
ID	8412714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	3051531
End bp	3052859
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	69%
IMG OID	645021508
Product	major facilitator superfamily MFS_1
Protein accession	YP_003178973
Protein GI	257389200
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.586334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACTGG ACACGGACGG TCGCGTCCTG ACACTGGCGT TCGCGCGGAT GGCCGACGCG 
CTGGGCAACT CCTTTCTGAT CATCGTCCTG CCGCTGTACA TAGCCAGCGG CCAGATCTCG 
CTGTCGGGCA TCGCCGGCAC GGAGATCCTC GGCTTCGTCC TGCGCGAGGA GACGCTGATC 
GGGCTCGTGC TCTCCCTGTT CGGTCTGCTG AACAGCTTCG GCCAGCCGTT CACCGGGCGG 
CTCTCCGACC GGACCGGCCG GCGGCGCGTG TTCGTCCTGA CGGGACTGGC GATCTTCGCC 
GTCGGCAGCG CGACCTACCC GTTCGTCACG AGCTACTGGT CGGTGCTCGG GGCACGTGCG 
CTCCAGGGGA TCGGCGCGGC CTTTACCGTG CCGGCCACGG TCGCGCTGGT CAACGACTAC 
GCGGCCAGCG ACCGCGAACG GGGCGGCAAC TTCGGCGTGT TCAACACCTT CCGGCTGATC 
GGCTTCGGCT TCGGGCCGAT CGTCGCCGGA GTCGTCATCA CGGGCGGGCT GGCCGCCGAG 
ACCGTCGTCA GCTACGCGCT CCCGGCCTGG CTCGGCCCCC TGGCCGGCCT CAGGTTCTCC 
GGGTTCGTCG CCGCCTTCGC CGTCGCCGTC CTCGGAGCGG TCGTCAGTTT CGTGCTCGTC 
GTCGCTCTGA TCGCGGACCC GCCGAAAGTC GTCGGCGGGG CGGGCAAAGA CCTCTCCATC 
GCGGTCCGCG ACCGCGACGG AAACGGGCTC GATCCCGTCT TCGTCCTCGG CGTCGGGACC 
TTCTTCATGG CCACGACGAT CGCGCTGTTC GCCACCCTGG AGGGGCCGAT CCGCGCGCGA 
CTGGACGAGA CGACGTTCCT CTTTTCGGTG CAGTTCGCCG CGGTCGTCAT CGCCAACGTC 
GTCTTCCAGA TCCCCATCGG GCGCGCCTCG GACGTGTACG GTCGCCGCCC GTTCATCATC 
GCGGGCTTCG TCGTCCTGAT CCCCGCCGTG TTCGCGCAAG GCGTCGTCAC GGGACCGTGG 
ACGATGCTCG CGGCCAGACT GCTCCAGGGC GTCGCCGTCG CGCTCGTGTT CGCGCCGTCG 
CTCGCGCTGG CTGGCGATCT CGCCGGGGAC CGCGGGTCGG GGACGACGCT GTCGGTGCTG 
ACGATGGCGT TCGGACTCGG CGTCGCACTC GGGCCACTCG CTTCCGGCGT GCTGTACAAC 
CTCGGCGGTC TCGTCGCGCC GTTTAGCTTC GGTGCCGTCC TGGCCGTGTT CGCGCTCCTC 
TTGACCTACT TCGAAGTCGA GGACACGCTG GAGACCGGTC GGGCCAGTGA GCCAGTGCCA 
CAGGAGTGA

Protein sequence

MVLDTDGRVL TLAFARMADA LGNSFLIIVL PLYIASGQIS LSGIAGTEIL GFVLREETLI 
GLVLSLFGLL NSFGQPFTGR LSDRTGRRRV FVLTGLAIFA VGSATYPFVT SYWSVLGARA 
LQGIGAAFTV PATVALVNDY AASDRERGGN FGVFNTFRLI GFGFGPIVAG VVITGGLAAE 
TVVSYALPAW LGPLAGLRFS GFVAAFAVAV LGAVVSFVLV VALIADPPKV VGGAGKDLSI 
AVRDRDGNGL DPVFVLGVGT FFMATTIALF ATLEGPIRAR LDETTFLFSV QFAAVVIANV 
VFQIPIGRAS DVYGRRPFII AGFVVLIPAV FAQGVVTGPW TMLAARLLQG VAVALVFAPS 
LALAGDLAGD RGSGTTLSVL TMAFGLGVAL GPLASGVLYN LGGLVAPFSF GAVLAVFALL 
LTYFEVEDTL ETGRASEPVP QE