Gene Anae109_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3643
Symbol
ID	5375099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	4256220
End bp	4257365
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	640845164
Product	arsenical-resistance protein
Protein accession	YP_001380807
Protein GI	153006482
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0704607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.350418
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC CCGCAGTCAC CCTCGCTGCG CCCTCCGGCG TCGCCCGCCG GCTCTCGTTC 
CTCGACCGCT ACCTGACCCT CTGGATCTTC CTCGCCATGG GCGCGGGCAT CGCGCTCGGC 
TGGGCCGTGC CCGGGGTCGT CCCGGCGCTC GACCGGCTGA GCGTCGGCAC GACCTCGATT 
CCCATCGCGA TCGGCCTGAT CCTCATGATG TACCCGCCGC TCGCCAAGGT CCGGTACGAG 
GAGCTGCCGC GGATCTTTCG CGACGGGAAG GTGCTCGGGC TGTCGCTCGT GCAGAACTGG 
GTGGTCGGGC CGCTGCTCAT GTTCGCGCTG GCCGTGATCT TCCTGCGAGA CAGGCCCGAG 
TACATGGTCG GGCTCATCCT GATCGGCCTC GCCCGCTGCA TCGCGATGGT CATCGTCTGG 
AACGACCTCG CGAGGGGCGA CACCGAGTAC TGCGCCGGCC TCGTCGCCTT CAACTCCATC 
TTCCAGGTGC TCTTCTTCTC CGTCTACGCC TGGATCTTCA TCACCGTGCT GCCTGGGTGG 
CTCGGCCTCC GGGGCGCCGA GGTCCACATC ACCATCGGCG AGATCGCCCG GAGCGTCTTC 
GTCTATCTGG GCATCCCGTT CCTCGCCGGG ATGGCGAGCC GCTTCGGGCT TCGGGCGTGG 
AAGGGCGAGG ACTGGTACCG CAGGGTGTTC ATCCCCCGGA TCTCGCCCGT CACGCTCGTC 
GCCCTCCTCT TCACCATCGT CGTGATGTTC TCCCTGAAGG GCGAGACCAT CGTGCAGGTG 
CCGCTCGACG TGGTGCGGAT CGCGATCCCG CTCCTCGTCT ACTTCCTGCT CATGTTCTTC 
GTCTCCTTCT GGATGAGCCG GAAGGTCGGC GCGACCTACG GGCAGACCGC CACGCTGTCC 
TTCACGGCCG CGTCGAACAA CTTCGAGCTC GCCATCGCGG TGGCGGTCGC GACGTTCGGC 
ATGTCCCACG GGGCGGCCTT CGCCGCCGTG ATCGGTCCCC TGGTCGAGGT GCCGGTCCTC 
ATCGGGCTCG TGAACGTGGC CCTGAAGCTG CGCGACCGCT GGTTCCCCGG CGAGACCGGC 
GAGCTCGGGA AGGTGGCGAG CTGCGCGGTC ACCGTGGAGG GCCCTGCGGC CAGGGGGGCG 
CCGTGA

Protein sequence

MSEPAVTLAA PSGVARRLSF LDRYLTLWIF LAMGAGIALG WAVPGVVPAL DRLSVGTTSI 
PIAIGLILMM YPPLAKVRYE ELPRIFRDGK VLGLSLVQNW VVGPLLMFAL AVIFLRDRPE 
YMVGLILIGL ARCIAMVIVW NDLARGDTEY CAGLVAFNSI FQVLFFSVYA WIFITVLPGW 
LGLRGAEVHI TIGEIARSVF VYLGIPFLAG MASRFGLRAW KGEDWYRRVF IPRISPVTLV 
ALLFTIVVMF SLKGETIVQV PLDVVRIAIP LLVYFLLMFF VSFWMSRKVG ATYGQTATLS 
FTAASNNFEL AIAVAVATFG MSHGAAFAAV IGPLVEVPVL IGLVNVALKL RDRWFPGETG 
ELGKVASCAV TVEGPAARGA P