Gene Paes_1958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1958
Symbol
ID	6459957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2139769
End bp	2140923
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	47%
IMG OID	642725943
Product	arsenite-activated ATPase ArsA
Protein accession	YP_002016617
Protein GI	194334757
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.367574
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATTA TCCTTTATCT GGGTAAAGGT GGAGTCGGCA AAACGACAGT TTCGGCTTCA 
ACAGCAACAG CGATTGCCCG TAGCGGCAAG CGGGTACTTA TTATGAGTAC GGATGTCGCT 
CATAGTCTTG CCGATGCCCT TGGTGTCGAG TTGAGCGCGA CACCCGTTGA GGTTGAAAAC 
AACCTTTTCG CCATGGAAGT TAATGTTCTG GCCGAAATCA GAGAGAATTG GACGGAACTC 
TATTCTTATT TCTCTTCGAT TCTGATGAAT GACGGTGCCA ACGAGGTCGT TGCCGAGGAG 
CTGGCTGTCG TTCCCGGCAT GGAGGAGATG ATCAGTTTGC GCTATATCTG GAAGGCTGCC 
AAGTCCGGAT TGTATGATGC CATTGTTGTT GACGCCGCAC CTACCGGTGA GACGATGCGT 
TTGCTTGGTA TGCCTGAATC GTATGGCTGG TACTCGGAAA AAATTGGCGG CTGGCACTCC 
AAGGCGATCG GTTTTGCTGC TCCGCTTCTG AACCGGTTTA TGCCCAAGAA AAATATTTTC 
AAGCTGATGC CTGAGGTGAA CGATCATATG AAGGAGCTGC ACGGCATGCT TCAGGATAAG 
TCGGTTACCA CATTCAGGGT CGTTGTCAAT CCTGAAAATA TGGTGATTAA AGAGGCGCTA 
CGTGTGCAGA CCTACCTTAA TCTTTTCGGC TATAAGCTCG ATGCGGTCAT TGTCAACAAG 
ATTCTGCCGG CAAGTTCGTC GGATGACTAT CTCAACAGTC TTATCGCTCT GCAGCAGAAG 
TATCTCAAGG TTATCGACGA CTGTTTCTAC CCGATTCCTA TTTTCAAGGC ATCTCAGGCT 
ACCCGCGAAG TGATCAAAAC TGATCAGCTC TATGCACTGA GCCAGCAGAT GTTCGATGGG 
CACAATCCTA TCGAAGTGCT TTATGCGGAT GATAAAACGC AGTCGATTGA AAAGATCGAT 
GGCAAGTATG TGTTGAAGCT GCACATGCCA AACGTTGAAA TTACGAAGCT CAATGTCAAT 
ATCAAGGGTG ACGAGCTTCT GGTTGATATC AACAACTTCA GAAAGAGCAT TGTTCTTCCC 
AATATTCTTG TCGGAAGAAA AACAGAAGGT GCTGATTTCG AGGGAGGACA TCTTAACATT 
ACTTTCGCGA ATTGA

Protein sequence

MRIILYLGKG GVGKTTVSAS TATAIARSGK RVLIMSTDVA HSLADALGVE LSATPVEVEN 
NLFAMEVNVL AEIRENWTEL YSYFSSILMN DGANEVVAEE LAVVPGMEEM ISLRYIWKAA 
KSGLYDAIVV DAAPTGETMR LLGMPESYGW YSEKIGGWHS KAIGFAAPLL NRFMPKKNIF 
KLMPEVNDHM KELHGMLQDK SVTTFRVVVN PENMVIKEAL RVQTYLNLFG YKLDAVIVNK 
ILPASSSDDY LNSLIALQQK YLKVIDDCFY PIPIFKASQA TREVIKTDQL YALSQQMFDG 
HNPIEVLYAD DKTQSIEKID GKYVLKLHMP NVEITKLNVN IKGDELLVDI NNFRKSIVLP 
NILVGRKTEG ADFEGGHLNI TFAN