Gene Hoch_2834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2834
Symbol
ID	8545222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3885987
End bp	3887024
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	646387523
Product	arsenical-resistance protein
Protein accession	YP_003267251
Protein GI	262196042
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.823873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.919185
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTATCT TTGAACGCTT TCTCTCCCTC TGGGTCGCGC TGGCCATCGC CGCCGGCGTC 
GGCCTCGGGC TCGTCGCTCC CGGGCTCTTC GAGGTCGTCT CCCGCTTCGA GTGGGCGCGC 
GTCAACCTCG TCGTCGCGGT GCTCATCTGG CTGATGATCT ACCCGATGAT GCTCAAGGTG 
GAGCCGTCGT GCCTCAAGGA CGTCGGCAAG AAGCCCAAGG GGCTCGCGCT CACCCTGGTC 
GTCAACTGGC TGATCAAGCC CTTCACAATG GCTGCCCTGG GCGTGCTCTT CTTCCAGCAC 
GTCTTCGCAG GCCTCGTCCC CGCCGAGGAC GCCCAGCAGT ACATCGCCGG CATGATCTTG 
CTCGGCGTCG CGCCGTGCAC CGCGATGGTC TTCGTCTGGA GCCACCTGAC CGACGGCGAC 
GCCAACTACA CGCTGGTCCA GGTCTCGGTG AACGACATCA TCCTCGTCTT CGCCTTCGCC 
CCCATCGCCG GGCTGCTGCT GGGCGTCACC GACCTCACGG TCCCCTGGGA GACGCTGCTC 
GCCTCGGTGG TGATCTTCGT CGTCATCCCG CTGGGCGCAG GGATGCTGAC CCACAAGCAA 
CTGATGAAGA CCGGCGGCGC CGAGGCCATC GAGCGGCTCT CGAGCAAGCT CAAGCCGACC 
TCCATCGTCG GGCTGCTGCT GACCGTCGTG CTTCTCTTCG GCTTCCAGGC CGAGACCATC 
GTCGACCAGC CCGGCCGCGT GGTGCTCATC GCCATCCCGC TGCTCATCCA GAGCTACGGC 
ATCTTTGCCA TCGCCTACGG GCTCGCTCGC GTGCTCAAGC TGCCGTTCAA CGTGGCGGCG 
CCGGCCGCGA TGATCGGCAC GTCCAACTTC TTTGAGCTGG CCGTCGCCGT CGCGATCAGC 
CTCTTCGGCC TCGCCTCGGG CGCGGCGCTC GCCACCGTGG TGGGTGTGCT CATCGAGGTG 
CCGGTGATGC TCTCGCTCGT CGCCTTCGCC AACCGCACCA AGGGCTGGTT CCCGGCCCCA 
TCATCTGCTT CCGCCTGA

Protein sequence

MGIFERFLSL WVALAIAAGV GLGLVAPGLF EVVSRFEWAR VNLVVAVLIW LMIYPMMLKV 
EPSCLKDVGK KPKGLALTLV VNWLIKPFTM AALGVLFFQH VFAGLVPAED AQQYIAGMIL 
LGVAPCTAMV FVWSHLTDGD ANYTLVQVSV NDIILVFAFA PIAGLLLGVT DLTVPWETLL 
ASVVIFVVIP LGAGMLTHKQ LMKTGGAEAI ERLSSKLKPT SIVGLLLTVV LLFGFQAETI 
VDQPGRVVLI AIPLLIQSYG IFAIAYGLAR VLKLPFNVAA PAAMIGTSNF FELAVAVAIS 
LFGLASGAAL ATVVGVLIEV PVMLSLVAFA NRTKGWFPAP SSASA