Gene Hmuk_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0046
Symbol
ID	8409543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	41791
End bp	42930
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	67%
IMG OID	645018384
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003175904
Protein GI	257386131
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.47667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACC GCGCCACGAC GACGGGCACT ACCCGGGACG ACGATGTCGT GATGTCGCTG 
GAGAACGTCT CGGTCGACTT CGAGAAAGAA CAGGGCGTCC TCGAGTCGCT GTTCGACGAG 
CCAGAGACCG TCCAGGCGGT CAGTGACGTG TCGATCGACA TCTCCGAGAA CGACGTGCTC 
GCACTCGTCG GGGAGTCTGG CTGCGGGAAG ACGACGCTTG GCAAGACGAT CATCGGCGTC 
CAGCGCCCCA CCGAGGGGAC CGTCTCCTAC CGGGGACAGG ACGTGTGGGA CGCCAAGGAC 
GGCCGCGGCG ACGTGACCGT CCCCTTCGAC GACATCCGTC GGTCGCTTCA GATGATCCAC 
CAGGACCCCG GCGCGGCGCT CAACCCCAAC CGGAAGGTCC TGACGACGCT GGAAGCGCCT 
CTGAAGAAGT GGGACCCCGA GATGTCCACC GAGGACCGCC GGGCGCGGAT CTTCGCGCTG 
CTGGACCGGG TGGGCATGGA GCCGCCCGAA GACTACGCGC ATCGGTTCCC CCACCAGCTC 
TCTGGGGGCG AACAGCAGCG GATCGCGCTG GTCCGGGCCC TGCTGATGAA TCCGGACGTG 
ATCCTCGCCG ACGAGGCCGT CTCGGCGCTG GACGTGTCGC TGCGCGTCGA GACGATGAAC 
CTCCTCCTGG AGCTGCAAGA GCAGTTCAAC ACCTCGTTCG TGTTCATCAG TCACAACCTC 
TCGAACGCCC GCTATCTGGC ACAGGAAGCG GGCGGACGCA TCGGCATCAT GTACCTCGGG 
GAGATCGTCG AGATCGGCCC GCCCGACGAG GTCCTGAACG ACCCCCAGCA CCCCTACACG 
AAGGTGCTGC GCTGGGCGAC CGCCGATCTG GATCCGACCG CCCAGGAGAT GACCGATCCG 
CCGGTCCGCT CGATCGACAT CCCGGACCCG GTGAATCCGC CGTCGGGCTG TCGGTTCCAC 
ACCCGCTGTC CGGAGGCTCG GGAGGTCTGT ACCACCACGG CTCCGGAACT TGGCGAGGAG 
GCGGCGACGG CGAGCGAACG CTGTGCCGCC TGCCACCGCA CCGATCCCGA CCACGAGTAC 
TGGGAGAGCG AACCCCTCGA CGGCGTCGAA GCCGCCGAGT CGCCGACACT GAACGACTGA

Protein sequence

MSDRATTTGT TRDDDVVMSL ENVSVDFEKE QGVLESLFDE PETVQAVSDV SIDISENDVL 
ALVGESGCGK TTLGKTIIGV QRPTEGTVSY RGQDVWDAKD GRGDVTVPFD DIRRSLQMIH 
QDPGAALNPN RKVLTTLEAP LKKWDPEMST EDRRARIFAL LDRVGMEPPE DYAHRFPHQL 
SGGEQQRIAL VRALLMNPDV ILADEAVSAL DVSLRVETMN LLLELQEQFN TSFVFISHNL 
SNARYLAQEA GGRIGIMYLG EIVEIGPPDE VLNDPQHPYT KVLRWATADL DPTAQEMTDP 
PVRSIDIPDP VNPPSGCRFH TRCPEAREVC TTTAPELGEE AATASERCAA CHRTDPDHEY 
WESEPLDGVE AAESPTLND