Gene Hmuk_2949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2949
Symbol
ID	8412502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	2832660
End bp	2833865
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	69%
IMG OID	645021296
Product	major facilitator transporter
Protein accession	YP_003178761
Protein GI	257388988
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.163593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.476505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACC CGCCAGTCGC CGAGTCGGAG CGACACCGTC CCGAGACCGA CCAGCAGTTC 
GAGATCGTCG ACGGTGTGCG CGTCGACCGC ACGCTGACGG ATCTCTTCGC GGCCGTCGCA 
TCGGTGGCGA CCTTCGACGG AGCACTGTAC GTCGTTGTTC GATTTCTCCC GGAGTACCTC 
AGCGTGCGTG GCGTCGGTCC GGTCGCGATC GGTGCGTTCG GCACGTTCTG GCTCGCGATC 
ACTGCGTTGG ATCGCCGAGA CACCGGTAGG CTTCCAGTGC TCGTGGCTGG TGCGACCGCC 
GGAGTGCTGG CCTGGCTGGT CGCTCCGACG GTCACGGACA GTACGCTAGC TCTCTGGGTG 
GCCGTCACAG CCGGTGGGCT CGGTCCGGCG GCCTGGTACT GGTCTCGCAC CGCGATCGGA 
GTCCCGCTCG CGGACGCCTG GCCACCTGCG TCGAGATCGA CTCGTCGACC CGGCGGACCC 
GTCTGGGTGC TCGGCCCACT CGTGCTCTCG ATCATCGTGT TAGTGCTCTC GGCGTCGTTT 
TCCGCGGGCT TTCGCATCGT CCTCGCACTG ACTGTCGCGC TGGGTGGGAC GGCGGGCGCG 
CTCTGGCTGT CGCTCGACGA CACCGGATCG CAGCCCTCGT CACGGCGTGT CCGCACTGTC 
CCCCACCTCG GGGATTCCCT GCTGGAGGTG GCGATGGGCG TGGTCTCCGT GTTCGTCGTC 
TTGGTCGTCA CGAGGGTTCT CGACGTCGAG CTGGCCGTTC TCGGCATCCA GTTGGGATCG 
GCGGCGACCT TCGGGCTCCT CTTGCTCGTC GAGATCGTCG CCGGAGCACT GGCCCGCACC 
GCTGGCCCCC GACTCGTCGG TTCCATCGGG TCGAGACCAC TCCTCGTCTA CGGGAGCCTC 
GTCGTCGCGG CGTTCCCCCT CGTCCTCGTG AGTGTGCCAC CGACCCCGCT GGCCGTGGGC 
GGTCTCTTCG CGATCTACGG CACTCGCTCC CTCGCGGGCG TCGCCCGTCG TGCCGGTGGT 
GCCATTTGCC GACCGGCCAG CGACCGTCGT CGAACCGTCG TCGTCGCCGC TGGACCGCTA 
CTTGGTGGCG TCCTCTTCGC CGTCGACCCC GTCCTCGCGT TCGGGTCCGC GACTGCGATC 
GGTGCCGTCG GTGTCTGGGA ACTCGCGCGG ACACACGTCA CGGGAGCCGG GTGGCGAGAC 
CGATGA

Protein sequence

MDDPPVAESE RHRPETDQQF EIVDGVRVDR TLTDLFAAVA SVATFDGALY VVVRFLPEYL 
SVRGVGPVAI GAFGTFWLAI TALDRRDTGR LPVLVAGATA GVLAWLVAPT VTDSTLALWV 
AVTAGGLGPA AWYWSRTAIG VPLADAWPPA SRSTRRPGGP VWVLGPLVLS IIVLVLSASF 
SAGFRIVLAL TVALGGTAGA LWLSLDDTGS QPSSRRVRTV PHLGDSLLEV AMGVVSVFVV 
LVVTRVLDVE LAVLGIQLGS AATFGLLLLV EIVAGALART AGPRLVGSIG SRPLLVYGSL 
VVAAFPLVLV SVPPTPLAVG GLFAIYGTRS LAGVARRAGG AICRPASDRR RTVVVAAGPL 
LGGVLFAVDP VLAFGSATAI GAVGVWELAR THVTGAGWRD R