Gene AnaeK_4018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_4018
Symbol
ID	6785488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	4540357
End bp	4541502
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	642765487
Product	arsenical-resistance protein
Protein accession	YP_002136352
Protein GI	197124401
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGAAG CGAACCTCGT TGCACCGGCC CGCGCCGGCG TCGCCCGCCG CCTCTCCTTC 
CTCGACCGCT ACCTCACGCT CTGGATCTTC CTCGCCATGG GCGCGGGCGT GGCGCTCGGG 
TTCCTCGTCC CCGGCGTCGT GCCGATGCTC GACCGGATGT CGGTCGGGAC GACCTCCATC 
CCGATCGCGA TCGGCCTCAT CCTGATGATG TACCCGCCGC TCGCGAAGGT CCGCTACGAG 
GAGCTCCCCC GGGTCTTCCG GAACGGCAAG GTGCTGGCGC TCTCGCTGGT GCAGAACTGG 
ATCGTGGGCC CGATCCTGAT GTTCGCGCTC GCGGTGATCT TCCTCCGCGA CCGCCCGGAG 
TACATGGTCG GGCTCATCCT CATCGGCCTC GCCCGCTGCA TCGCGATGGT CATCGTGTGG 
AACGACCTCG CGAAGGGCGA CACCGAGTAC TGCGCCGGCC TGGTCGCGTT CAACTCGATC 
TTCCAGGTGC TGTTCTTCTC GGTCTACGCC TGGATCTTCA TCACCCTGCT GCCCGGCTGG 
CTCGGCGTGC GCGGCGCCGA GGTGCACATC ACCATCGGCG AGATCGCCCG GAGCGTCTTC 
GTCTACCTCG GCGTCCCGTT CATCGCCGGG ATGGCGAGCC GCTTCGGGCT CCGGGCGCTG 
AAGGGCGAGG AGTGGTACCG CAGGGTGTTC ATCCCCCGGA TCTCCCCGAT CACGCTCGTC 
GCCCTGCTCT TCACCATCGT GGTGATGTTC TCGCTGAAGG GCGAGACCAT CGTGCAGGTG 
CCGCTCGACG TGGTGCGGAT CGCCCTCCCG CTGCTCGTCT ACTTCCTGCT CATGTTCTTC 
GTGTCCTTCT GGATGAGCCG GAAGGTGGGC GCGACCTACG GGCAGACCGC CACGCTCTCG 
TTCACGGCCG CCTCGAACAA CTTCGAGCTC GCCATCGCGG TCGCGGTCGC CACCTTCGGC 
ATGGCGCACG GCGCCGCCTT CGCCGCGGTG ATCGGCCCGC TGGTCGAGGT CCCGGTGCTC 
ATCGGCCTCG TGAACGTCGC GCTCCGGCTG CGCGATCGGT GGTTCCCCGG CGAGACCGGC 
GAGATCGCGA AGGTCGCGAA CTGCGCGGTG ACCGTCGAGC GGCCGACCGC CGGGCGGGGG 
CGGTGA

Protein sequence

MSEANLVAPA RAGVARRLSF LDRYLTLWIF LAMGAGVALG FLVPGVVPML DRMSVGTTSI 
PIAIGLILMM YPPLAKVRYE ELPRVFRNGK VLALSLVQNW IVGPILMFAL AVIFLRDRPE 
YMVGLILIGL ARCIAMVIVW NDLAKGDTEY CAGLVAFNSI FQVLFFSVYA WIFITLLPGW 
LGVRGAEVHI TIGEIARSVF VYLGVPFIAG MASRFGLRAL KGEEWYRRVF IPRISPITLV 
ALLFTIVVMF SLKGETIVQV PLDVVRIALP LLVYFLLMFF VSFWMSRKVG ATYGQTATLS 
FTAASNNFEL AIAVAVATFG MAHGAAFAAV IGPLVEVPVL IGLVNVALRL RDRWFPGETG 
EIAKVANCAV TVERPTAGRG R