Gene Hmuk_1541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1541
Symbol
ID	8411062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1470526
End bp	1472100
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	69%
IMG OID	645019867
Product	Na+/solute symporter
Protein accession	YP_003177363
Protein GI	257387590
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.69558
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACA CGACGATCCA GCTGGGCATC GTCGGCGGCT ACATGGTACT GGCGGCGGCC 
ATCGGCGTCG TCGCCTACCG CCTGACCGAT CGCACGGCGG AAGACTACTA CCTCGCCAGC 
CGGACATTCG GCACGGTCGT ACTCCTGTTC ACGACGTTCG CGACGCTGCT GTCGGCCTTT 
ACCTTCTTTG GCGGCCCGAA CCTCACCTTC GCGCAGGGAC CCGAGTGGCT GCTGGTGATG 
GGGCTGATGG ACGGGATCAT CTTCGCCGTC CTCTGGTACG TGCTGGGGTA CAAGCAGTGG 
CTCGTCGGCC AGCGCCACGG CTACGTCACG CTCGGGGAGA TGCTGGGCGA TCGCTTCGGC 
TCGCGTCTCC TCCGCGGGCT CGTGGCGGCG ATCAGTCTCT TCTGGCTCTT TCCCTACGTG 
ATGCTCCAGC AGAAGGGTGC CGGCCAGGCG GTCGTCGGAC TGACCGACGG CGCGGTCCCG 
TTCTGGGTCG GTGCCGGCGG CATCACGCTC TTTATGATCG TCTACGTCGC CGTCTCGGGG 
ATGCGCGGGG TCGCCTGGAC CGACACGCTC CAGGGGATCG TCATGCTCGG GCTGATCTGG 
GCGGCCGTCG CCTGGATCCT CTCGGCGGTC GGCGGCCCGG CGGCGGCGAC GGACCGACTG 
GCCGAGACCA ACCCCGAGTT CCTCGCACTG GGCGGCGGGC TGTACACGCC GGAGTACGTC 
CTCTCGACGG CGATTTCCAT CGCCTTCGGC GTGACGATGT TCCCCCAGAT CAACCAGCGC 
TTCTTCGTCG CTCGCTCCCA GAAAGTGCTC AAGCGGACGC TGGCGCTGTG GCCCGTACTG 
GTGGTCCTGC TGTTCGTCCC CGCGTTCATG CTCGGCGCGT GGGCCGCCGG CCTGGGCGTC 
ACCGTTCCGG AGAACGGCAA CGTGATCCCG GCGGTGCTCA ACGAGTACAC CGCCGGGTGG 
TTCACGGCGG CCGTCGTCGC CGCGGCGCTG GCCGCCATGA TGTCCTCCAG CGACTCGATG 
CTGCTCTCGG GCGCCTCCTA CCTCACTCGC GACCTCTACC GACCGGTGAC CGACCTCGCC 
GAGGAGGAGC CGACGCTGCC GGACCGCGCG TCGCTGGTGA ACCGCGTCCG CCGATCCCTG 
CTCGCAGTCG CCGTCTCCGT CGGTCGCACG CTTCACTCCG ACCGCGACCG CGAGACGCTG 
CTCGCCCGCG CTGGCGTGGT CGTCTTCGCG ACGGTCTCGT TCGTCGCCAG CCTCTACGCG 
CCGGGAACGC TCGTCCAGAT CGGCGACACC GCGTTCGGCG GCTTCGCCCA GCTGGCCCTG 
CCCGTCATCG TCGCGCTGTA CTGGCCCCGG ACGACCCGCT GGGGGATGTA CGCCGGCGTC 
GGCGGCTCGC AGCTGTTCTA CCTCGCCAGC GTCTTCCTCC CGTTCGTGCC CGGCAGCTAC 
CTCGGTGGCT GGTCGGCCAG CGTCGTCTGC ATGGCGCTGG GACTGGTCCT GACCGTCGGC 
GTCTCGCTCG TGACGAGCGC GTCCCCCGGC GAGGACGCCG GCCTGTACAG CGTCTCGGGT 
GTCGACGGCG ACTGA

Protein sequence

MADTTIQLGI VGGYMVLAAA IGVVAYRLTD RTAEDYYLAS RTFGTVVLLF TTFATLLSAF 
TFFGGPNLTF AQGPEWLLVM GLMDGIIFAV LWYVLGYKQW LVGQRHGYVT LGEMLGDRFG 
SRLLRGLVAA ISLFWLFPYV MLQQKGAGQA VVGLTDGAVP FWVGAGGITL FMIVYVAVSG 
MRGVAWTDTL QGIVMLGLIW AAVAWILSAV GGPAAATDRL AETNPEFLAL GGGLYTPEYV 
LSTAISIAFG VTMFPQINQR FFVARSQKVL KRTLALWPVL VVLLFVPAFM LGAWAAGLGV 
TVPENGNVIP AVLNEYTAGW FTAAVVAAAL AAMMSSSDSM LLSGASYLTR DLYRPVTDLA 
EEEPTLPDRA SLVNRVRRSL LAVAVSVGRT LHSDRDRETL LARAGVVVFA TVSFVASLYA 
PGTLVQIGDT AFGGFAQLAL PVIVALYWPR TTRWGMYAGV GGSQLFYLAS VFLPFVPGSY 
LGGWSASVVC MALGLVLTVG VSLVTSASPG EDAGLYSVSG VDGD