Gene Apre_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0354
Symbol
ID	8397128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	403469
End bp	405211
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	38%
IMG OID	644994712
Product	arsenite-activated ATPase ArsA
Protein accession	YP_003152124
Protein GI	257065868
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAT TTGATATCAA GGAAATTGAC TTAACTAAAT ACTTATTTTT CACAGGAAAG 
GGAGGAGTCG GCAAGACTTC TACTGCCTGT GCTAGTGCAA TAAGTCTAGC TGATGAGGGC 
AATGAAGTCC TATTAATTAG TACTGACCCT GCTTCAAACC TTCAAGATGT TTTTGAAACT 
GAGCTTGATA ACAAGGGTGT GAGGATAGAA GGTGTGGATG GACTTACTGT AGCCAACCTA 
GATCCTATAG AAGCTGCCAA TGAGTATAAG GAAAGTGTAG TTGGTCCCTA CAGAGGAAAG 
TTACCTAAGA GTGTAATAGA AAATATGGAA GAGCAATTAT CTGGATCTTG TACTGTAGAG 
ATAGCTGCTT TTAATGAATT TTCTAAGTTT ATAACTGATG CTGACCTAAA GGACAAATAT 
GATTATATAA TATTTGACAC AGCACCAACA GGCCACACCC TAAGGATGCT CCAACTTCCT 
TCGGCTTGGA CGAGCTTTAT CAGCGAATCC ACCCACGGAG CTTCATGCCT AGGTCAATTA 
TCAGGTCTAG AAGATGAGAA GGAAACATAC AAGTATGCTG TGGATACCCT AGCTGATGGT 
AAACTTACAA GTCTAGTATT AGTTGCAAGA CCTGAGGAGA CTCCTCTACT TGAAGCAAAT 
AGAGCCTCTT ACGAGCTCGC AGAATTAGGT ATTAACAATC AAATCCTTAT CATAAATGGC 
CTATTAAGTG GCCATGATGA TGAAGTATCA GAAGCTTTTT ATAAAAAGCA AAAAGAATCT 
TTAGATAAGA TGCCAGAAGG CATTAAGGAT CTTAAAACTT TCTTTATTCC ACTTAGGGGA 
TACAACTTAA ACAGTATCGA AAATTTAAGA TCCCTTCTGG TTGAGGATAA GGAAAATACT 
AGTGATGTAG ACCTTAATAT AGGAGAAATT CCAAGGCTAA AAGATATTAT AGATGACTTA 
TATAAGAATA AGAAAAAAGT TATCTTTACC ATGGGAAAGG GCGGTGTAGG AAAGACCACG 
ATGGCATCTG CTATCGCCAA GGGCCTTACC GCTAAGGGAG AGAAGGTCCA TCTAACTACA 
ACCGATCCAG CTAACCACTT GACTGGTATG ATTCGTGAAG ACGACTTATT AACTATAAGC 
CATATAGATG AAGAAGAAGA GCTTAAAAAA TACCAAGAAG AAGTTCTAGA AAATGCTAGA 
AAAACCATGT CTGATGAAGA CTTGGAGTAT ATAAAAGAAG ATTTAAGATC ACCATGTACC 
CAAGAGATTG CTGTATTTAG AGCCTTTGCG GATGTGGTTG ATAGAGCAGA TGATGAGATT 
GTTGTAATCG ATACAGCCCC AACAGGACAT ACACTTCTGC TCCTAGATTC TACAGAATCC 
TATAACAAAG AGATAGAGAA GAACCAAGGC AATGTCCCAG AATCAGCAAA GAAACTTCTC 
CCTAGACTAA AAAATAGTGA TGAAACAGAA GTCCTAATTG TAACCCTTGC TGAGCCAACT 
CCATTCTATG AGTCTCAAAG ACTTGAAGAA GACCTAAAAA GAGCGGGAAT TTATAGCAAG 
TGGTGGATTA TAAATTCATC TATATATAAG ACTGGCTCTA GGAACAAGAC TCTACAAGCC 
AAGGCTAATA GTGAGATAGA ATGGATAAAA AAGATTGATG ATCGTACAGA CGGAAACTTC 
ACAATAATCC CATGGTCAAG TGATGAGATT AAGGGATCTA GTTTAGATAA ATTAATTAAG 
TAG

Protein sequence

MKQFDIKEID LTKYLFFTGK GGVGKTSTAC ASAISLADEG NEVLLISTDP ASNLQDVFET 
ELDNKGVRIE GVDGLTVANL DPIEAANEYK ESVVGPYRGK LPKSVIENME EQLSGSCTVE 
IAAFNEFSKF ITDADLKDKY DYIIFDTAPT GHTLRMLQLP SAWTSFISES THGASCLGQL 
SGLEDEKETY KYAVDTLADG KLTSLVLVAR PEETPLLEAN RASYELAELG INNQILIING 
LLSGHDDEVS EAFYKKQKES LDKMPEGIKD LKTFFIPLRG YNLNSIENLR SLLVEDKENT 
SDVDLNIGEI PRLKDIIDDL YKNKKKVIFT MGKGGVGKTT MASAIAKGLT AKGEKVHLTT 
TDPANHLTGM IREDDLLTIS HIDEEEELKK YQEEVLENAR KTMSDEDLEY IKEDLRSPCT 
QEIAVFRAFA DVVDRADDEI VVIDTAPTGH TLLLLDSTES YNKEIEKNQG NVPESAKKLL 
PRLKNSDETE VLIVTLAEPT PFYESQRLEE DLKRAGIYSK WWIINSSIYK TGSRNKTLQA 
KANSEIEWIK KIDDRTDGNF TIIPWSSDEI KGSSLDKLIK