Gene Hmuk_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1810
Symbol
ID	8411336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1731138
End bp	1732292
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	65%
IMG OID	645020140
Product	arsenical-resistance protein
Protein accession	YP_003177631
Protein GI	257387858
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.324178
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.452859
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG GCGAACACGA CCACGGGCCG GACTGCGAGT GTGAGAGCTG TGGAGACCCA 
CGGTCGATGG ACGTGCTCGA CAAGTACCTC ACCGTCTGGA TCTTCGGCGC GATGGCGGTC 
GGCGTCGGTC TCGGGTTCGT CGCTCCGTCG GTGACTCAGC CGATTCAGGA TCTCCACCTC 
GTGGAGATCG GCCTGATCCT GATGATGTAC CCGCCGCTGG CCAAGGCCGA CTACTCGCAG 
CTCCGGACCG TCTTCAGCAA CTGGCGCGTA CTCGGGCTGA GCCTCGTCCA GAACTGGCTG 
ATCGGTCCGA CGCTGATGTT CGGACTCGCC GTGATCTTCT TCAGCGGTCT CGTCCCGGGA 
CTGCCCGCTC GTCCCGAGTA CTTCCTCGGC CTGGTGTTCA TCGGGATGGC CCGCTGTATC 
GCGATGGTCC TCGTCTGGAA CGAACTCGCG GAGGGGTCGA CCGAGTACGT GACGGGACTG 
GTCGCGTTCA ACAGCCTCTT CCAGATCGTC ACCTACGGGG TCTACGTCTG GTTTTTCGCC 
CTCTTTCTCC CGCCGGTGCT GGGCATGGAG TCGCTGGTCG CCGGCATCAC GACCTTCGAC 
ATCACGCCGA TGCAGGTGTT CGAGGCGATC GTCGTCTACC TCGGGATTCC CTTTGGGGCC 
GGGTTCCTGA GCCGCTACGT GGGGACCCGC GTCAAGAGCG AAGCGTGGTA CGAGGAGGAG 
TTCGTCCCGA GGATCGATCC GCTGACACTG GTCGCGCTGC TCTTTACGGT CGTCGTGATG 
TTCGCCACGC AGGGCGGAGC CATCGTCGCG TCGCCGGGCG ACGTGTTGCT GATCGCGGTG 
CCGCTGACGA TCTACTTCGT CGTGATGTTC CTCGTGAGCT TCGGTATGGG ACGGGGCATC 
GGTGCGGACT ACTCGACGAC GACGGCGATC GGGTTCACCG CCGCCTCGAA CAACTTCGAA 
CTGGCGATCG CGGTCGCGGT CGCGGTGTTC GGCGTCGGCT CCGGCGTCGC GTTCGCGACC 
GTCGTCGGCC CGCTCATCGA GGTGCCGGTC CTGCTCGCGC TGGTCAACGT CGCGCTGTAC 
TTCCAGCGCC GGTACGACTG GGGCGGTGCC ACGACCGGAC AGCTCGACCG TTCCGGAGCG 
ACAGACGACG ATTGA

Protein sequence

MSNGEHDHGP DCECESCGDP RSMDVLDKYL TVWIFGAMAV GVGLGFVAPS VTQPIQDLHL 
VEIGLILMMY PPLAKADYSQ LRTVFSNWRV LGLSLVQNWL IGPTLMFGLA VIFFSGLVPG 
LPARPEYFLG LVFIGMARCI AMVLVWNELA EGSTEYVTGL VAFNSLFQIV TYGVYVWFFA 
LFLPPVLGME SLVAGITTFD ITPMQVFEAI VVYLGIPFGA GFLSRYVGTR VKSEAWYEEE 
FVPRIDPLTL VALLFTVVVM FATQGGAIVA SPGDVLLIAV PLTIYFVVMF LVSFGMGRGI 
GADYSTTTAI GFTAASNNFE LAIAVAVAVF GVGSGVAFAT VVGPLIEVPV LLALVNVALY 
FQRRYDWGGA TTGQLDRSGA TDDD