Gene Rmet_3991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_3991
Symbol	arsB1
ID	4040849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	559311
End bp	560570
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	67%
IMG OID	637979415
Product	arsenite permease
Protein accession	YP_586128
Protein GI	94312919
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0830422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.159952
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCT ACGCGACACC GCTGATCTGG AGCGTCGCGG CACTATCCAC GGCGGGCGTG 
CTGTTCCGGC CCTTTCGCCT GCCCGAGCCG TTCTGGGCAA TGGCTGGCGC GCTGGTGCTA 
TGCGTGGCAG GACTGCTGCC ATGGCGCGAC GCCCTGCAAG CCGTGGCACG CGGCAACGAC 
GTCTATCTGT TCCTGGCCGG GATGATCCTG ATCTCGGAAC TCGCCCGCAA GACAGGTCTG 
TTCGATCATG TGGCCGCGCT GGCCGTGCGC GCCGCGCGGG GGTCGGCGCG CAAGCTATTT 
GCGCTGGTCT ATGGCTTCGG CATTGCGGTG ACAGCGTTCA TGTCGAACGA TGCCACGGCA 
GTCGTCCTCA CCCCCGCGGT CATCGCCGCG ACACGCGCGG CACGGGTCAA GCACCCGTTA 
CCCTATCTCT ACGCCTGCGC GTTCATCGCC AATGCGGCGA GCTTTCTCCT GCCGATCTCT 
AATCCGGCCA ACCTCGTGCT GTTCGGTGAC CGCATGCCAC CTCTGACCAG TTGGCTGGCA 
CGCTTCACGC TGCCGTCGGT GGTGGCCATC GCCATGACGT TCATCGTCCT GTACTGGACG 
CAACGCGATG CACTGGCCGA GCCGATTGAG AACGACGTGC CGACGCCCCC TCTGACGCTC 
CAGGCCTGGC TGACGACGCT GGGCATCATG CTGACCGGAG CGGCACTGTT GACGGCCTCG 
CTGCACGGGC AGGATCTCGG CTGGCCGACG TTCATCGGTG GTCTGTTGAC CCTGGCTGTC 
GTCTGCGCCA CCCAGCCGCG ACTGCTTGTG CCGGCGCTCA AGGAGGTGTC CTGGGGCGTA 
TTGCCGTTGG TGGCCGGACT GTTCGTCCTG GTTGCCGGCC TGGCCCAGAC CGGCTTGACC 
GCTCAGCTTG CACATTGGGT GCGGATGCTA TCCGGGCTGC AAGGGCCGGA GGCCGTGCTT 
GGCGCCGGTG TGGCGGGCGT GCTCGTCGGC ATCACGAGCA ACATCGTCAA CAACCTGCCG 
GCCGGACTGT TCGCAGCCTC GGCGCTGGCG GCAGGCCACG CCTCTGATAC CGTCACGGCT 
GCCGTGCTGA TCGGTGTGGA CCTGGGCCCG AACCTGTCCA TTACCGGCTC GCTGGCCACC 
CTGCTCTGGC TGACCGCCCT GCGCCGTGAA GGTCATATGG TCGGCGCCGG CACCTTCCTG 
AAGACCGGTG CGCTCGTCAT GCCGCTGGCA CTACTCCCGG CCCTGGCGGT ACTGCGCTGA

Protein sequence

MPAYATPLIW SVAALSTAGV LFRPFRLPEP FWAMAGALVL CVAGLLPWRD ALQAVARGND 
VYLFLAGMIL ISELARKTGL FDHVAALAVR AARGSARKLF ALVYGFGIAV TAFMSNDATA 
VVLTPAVIAA TRAARVKHPL PYLYACAFIA NAASFLLPIS NPANLVLFGD RMPPLTSWLA 
RFTLPSVVAI AMTFIVLYWT QRDALAEPIE NDVPTPPLTL QAWLTTLGIM LTGAALLTAS 
LHGQDLGWPT FIGGLLTLAV VCATQPRLLV PALKEVSWGV LPLVAGLFVL VAGLAQTGLT 
AQLAHWVRML SGLQGPEAVL GAGVAGVLVG ITSNIVNNLP AGLFAASALA AGHASDTVTA 
AVLIGVDLGP NLSITGSLAT LLWLTALRRE GHMVGAGTFL KTGALVMPLA LLPALAVLR