Gene Apre_0356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0356
Symbol
ID	8397130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	405631
End bp	406671
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	34%
IMG OID	644994714
Product	arsenical-resistance protein
Protein accession	YP_003152126
Protein GI	257065870
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC AAGAAGATAT AAGCTTTTTT GAAAGAAATC TTACATTTTG GGTCTTGATA 
TGCATGGTTA TAGGTGTTTT AATTGGACGC TTTATACCTG CTATTCCAGA GACTTTGGGA 
GAGTTTGAGT TTTACAATGT ATCTATTCCA ACAACCATAC TTCTTTGGAT CATGATATAT 
CCAATGATGT TAAAGATTGA TTTTAATAGT ATAAAAAATA TCAAAAACAA TCCTAAGGGA 
CTCTTTATAA CCTGGATTGC CAACTGGATT ATCAAACCCT TTACTATGTA TCTAATAGCT 
AGATTATTTT TCTTTGGTAT TTACAAAAAT ATCATTAGTG GAGATCTAGC ATCAGAGTAC 
CTAGCAGGAG CAGTTTTATT AGGAGCAGCT CCATGTACGG CCATGGTATT TGTTTGGAGT 
AAGTTAACAA GAGGTAATAG TGCCTATACC CTAGTTCAAG TGGCGAGCAA TGATTTAATT 
TTGCTATTGG CCTATATTCC AATAGTAAGC TTCTTACTAA AGAGGGGCAA TATCAATATA 
CCTTGGGGGA CCCTACTTTT ATCAATCGTA CTATTTATAG TAGTGCCTCT TATATTTAGT 
ATCTTAACAA GAAGGCGTGT AATAAAAAAT AAGGGTGAAG ATTACTTAAA TAATGTATTT 
ATCCCATCAT TTGATAAGTA TACTATGGTT GGGTTATTAC TAACTTTGAT AATTATATTC 
TCATTCCAAG GGATGAAAAT TATCGACCAA CCTCTAAATA TAGCTCTTAT AGCAGTACCA 
CTTATACTTC AAACCTTCCT TATATTTGCT ATAACCTTTG GCATGGCATA CCTTGCTAAG 
CTACCTTATT CTATAGCTGC TCCATGTGGA ATGATAGGAG CATCTAACTT CTTCGAATTA 
TCCGTAGCTG TTGCTATCTC ACTATTTGGC CTATCATCTG GTGCAACCCT TGCAACTGTG 
GTAGGAGTTT TGGTAGAGGT ACCGGTAATG CTGCTTTTAG TAAGAATAGC AAACTCAATG 
AAACATAGGT TTAAGAGATA A

Protein sequence

MKKQEDISFF ERNLTFWVLI CMVIGVLIGR FIPAIPETLG EFEFYNVSIP TTILLWIMIY 
PMMLKIDFNS IKNIKNNPKG LFITWIANWI IKPFTMYLIA RLFFFGIYKN IISGDLASEY 
LAGAVLLGAA PCTAMVFVWS KLTRGNSAYT LVQVASNDLI LLLAYIPIVS FLLKRGNINI 
PWGTLLLSIV LFIVVPLIFS ILTRRRVIKN KGEDYLNNVF IPSFDKYTMV GLLLTLIIIF 
SFQGMKIIDQ PLNIALIAVP LILQTFLIFA ITFGMAYLAK LPYSIAAPCG MIGASNFFEL 
SVAVAISLFG LSSGATLATV VGVLVEVPVM LLLVRIANSM KHRFKR