Gene Paes_1353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1353
Symbol
ID	6460289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1472209
End bp	1473402
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	47%
IMG OID	642725337
Product	arsenite-activated ATPase ArsA
Protein accession	YP_002016022
Protein GI	194334162
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.284232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00308524
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCAATA TCATTTTTAC GGGTAAGGGA GGCGTTGGAA AAACCTCTGT TGCAGCCGCA 
ACAGCACTGA AAGCTGCTGA CATGGGTTAT AAAACCCTGA TAATGTCTAC TGATCCCGCT 
CACAGTCTCG GTGATTCACT TGATGTGCAG CTTGGCCCTT CCCCTGTCAA GGTTGCTGAA 
AATCTCTGGG GTCAGGAAGT CAGTGTTTTC GGTGATCTGA ACCTGAACTG GGATGTTGTT 
CGGGAACACT TTGCTCAGCT AATGGAATCA AGAGGTGTAG AGGGTATTTA TGCTGAAGAG 
ATGGGTGTCC TTCCTGGTAT GGAAGAGCTT TTCTCTCTCT CCTACATCAA ACGTTATAAC 
GAAGAAGAGT CCGATTACGA CCTGCTTGTC GTTGACTGTG CTCCTACCGG CGAAACGCTT 
CGTCTCCTTT CACTTCCCGA GACATTCGGC TGGTTTATCA AGCTGATCCG CAACGTTGAG 
AAATATATGG TCAAGCCAAT GATCAGGCCG CTCTCCAAAA AGGTCAAGAA AATTGACTCG 
ATGGTCGCAC CTGAAGAGGT TTACGAGAAA GTCGACAATC TGTTCGCTTC AACAGAAGGC 
ATCATCGAGC TGCTTGCCGA CGGTTCAAAA TCGACCGTTC GTCTTGTTAT GAACCCTGAA 
AAGATGGTTA TCAAAGAGTC CATGAGGGCG CTGACCTATC TCAACCTCTA TGGCATCACT 
GTTGACAGCA TCACTATCAA CAGAGTCATG CCTGCTCATA CCGAGGATCC TTATTTCAAG 
AAATGGAGAG ATATTCAGCA GAATTATATC AAACAGATTG AAGGTTCATT CGCGCCTATT 
CCGATCGGCC AGGTTCCTTT GTTTGATCAG GAGGTCGTCG GTCTTGACAT GCTTCGTCAG 
GTTGGTGAGA AAGTCTATGC CGAAAAGAAT CCTGTCGATA TTTTCTTCAA GGAAGACCCG 
ATTGCTATTG AGAAGGTCAA CGATGGTCAC TACAAGGTTC GAGTGAAATT GCCATTTATG 
GAAACTATGG GACAGGAGCC CAAGATCCTT AAGCTCGGCG ATGATCTTAC CATCAGAATT 
GGCGATTATC AGAAGGTTGT CGCTCTGCCG ATCTTTATTG CCGGACTTGA ATCTTCCGGA 
GCGAGCTTTG ACAACGGCTG GCTCAGCATC GACTTTACCA GGGACGGCGA GTAA

Protein sequence

MRNIIFTGKG GVGKTSVAAA TALKAADMGY KTLIMSTDPA HSLGDSLDVQ LGPSPVKVAE 
NLWGQEVSVF GDLNLNWDVV REHFAQLMES RGVEGIYAEE MGVLPGMEEL FSLSYIKRYN 
EEESDYDLLV VDCAPTGETL RLLSLPETFG WFIKLIRNVE KYMVKPMIRP LSKKVKKIDS 
MVAPEEVYEK VDNLFASTEG IIELLADGSK STVRLVMNPE KMVIKESMRA LTYLNLYGIT 
VDSITINRVM PAHTEDPYFK KWRDIQQNYI KQIEGSFAPI PIGQVPLFDQ EVVGLDMLRQ 
VGEKVYAEKN PVDIFFKEDP IAIEKVNDGH YKVRVKLPFM ETMGQEPKIL KLGDDLTIRI 
GDYQKVVALP IFIAGLESSG ASFDNGWLSI DFTRDGE