Gene Dtpsy_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_2139
Symbol
ID	7383074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	2285265
End bp	2287028
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	61%
IMG OID	643655456
Product	arsenite-activated ATPase ArsA
Protein accession	YP_002553592
Protein GI	222111328
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAT TCCTGCAACT TCCTTCCCGC TTTCTGTTTT TCACGGGCAA GGGCGGCGTC 
GGCAAAACCT CGATTGCCTG TGCCACGGCT ATTCAATTGG CCGAAGCCGG AAAGCGCGTC 
CTCCTGGTCA GTACCGACCC GGCATCCAAC GTTGGGCAGG TATTTGGTGT TGATATCGGT 
AATCGCGTCA CACCGATTCC GGCGGTTCCA CGTCTTTCTG CTCTGGAGAT TGATCCCGAG 
GCAGCGGCCA GCGCCTATCG GGAGCGCCTG GTCGGCCCGG TACGCGGCGT GCTTCCTGAT 
GACGTGGTGA AGGGCATCGA AGAATCGTTG TCCGGCGCGT GCACCACCGA AATCGCCGCA 
TTTGACGAGT TCACCGCACT GCTGACCAAC ACGGCACTTA CGGCTGATTA CGAGCACATC 
ATCTTTGATA CTGCGCCCAC CGGCCACACC ATCCGCTTGC TGCAACTGCC GGGCGCGTGG 
AGTGGTTTCC TGGAAGCTGG CAAGGGTGAT GCCTCGTGCC TCGGCCCGCT GGCCGGTCTG 
GAAAAGCAGC GGAACCAGTA CAAGGCGGCT GTTGAAGCCT TGGCCGATCC GCTGCACACC 
CGTCTGGTGC TGGTCGCTCG CGCCCAGCAG GCGACCTTGC GCGAGGTAGC CCGAACCCAC 
GAAGAACTGG CAGCCATAGG CCTCAAACAG CAACATCTCG TCATCAACGG CATCCTGCCG 
CACGTCGAAG CCGCTACCGA CCCGCTGGCC GCAGCAATCC ACGAACGGGA ACAAACGGCG 
CTGAAGAACA TCCCGACTAC GTTGACTGCG CTTCCGCGTG ATCATGTAGA ACTCAAGCCC 
TTCAATCTCG TCGGCCTTGA AGCACTGCGG CAGTTGCTGA CCGACCTTCC TCCACAAGCA 
CCCGCAGCGG TTGATTCCCC GATCGAACTC GACGAGCCCG GCATGGCCGA CCTGATCGAC 
GGCATCGCGG CGGATGGACA CGGGCTGGTC ATGTTGATGG GCAAAGGTGG TGTAGGCAAG 
ACGACCCTGG CGGCCGCCAT CGCGGTCGAA CTGGCACATC GTGGCTTGCC GGTGCATCTG 
ACGACCTCCG ATCCTGCGGC CCATTTGACC GATACCCTGG AAGCCTCGCT CGATAATCTG 
ACCGTGAGCC GGATCGATCC GCACGCCGAG ACCGAGCGCT ATCGCCAGCA CGTGCTGGAA 
ACCCAGGGCG CTCAACTCGA TGCCGAAGGC CGCGCGCTGT TGGAAGAGGA TTTGCGTTCG 
CCCTGCACGG AAGAGATTGC GGTCTTCCAG GCGTTCTCCC GCATCATTCG CGAGGCCGGG 
AAAAAGTTCG TCGTCATGGA CACGGCCCCG ACCGGGCACA CCTTGCTCCT GCTCGACGCG 
ACGGGTGCGT ATCACCGCGA AGTGTCACGA CAAATGGGCA AGACCGGCAT GCACTTCACG 
ACGCCGATGA TGCAATTGCA GGATCCGAAA CAAACGAAGG TACTCGTCGT CACGCTGGCG 
GAGACGACGC CGGTACTGGA GGCCGCCAAC CTGCAAGCTG ATTTGCGCCG TGCCGGGATC 
GAGCCCTGGG CCTGGATCAT CAACACCAGC GTGGCGGCAG CTTCGGCCAA GTCGCCGTTA 
CTGCGTCAGC GTGCGGCCAA CGAGCTACGC GAAATCAGCG CTGTGGCGAA TCAGCACGCG 
GACCGTTACG CGGTTGTCCC GCTGCTGAAG GAAGAACCGA TCGGTACAGA ACGACTGCGT 
GCGCTCATCC ATCCTCAAGC ATAA

Protein sequence

MMKFLQLPSR FLFFTGKGGV GKTSIACATA IQLAEAGKRV LLVSTDPASN VGQVFGVDIG 
NRVTPIPAVP RLSALEIDPE AAASAYRERL VGPVRGVLPD DVVKGIEESL SGACTTEIAA 
FDEFTALLTN TALTADYEHI IFDTAPTGHT IRLLQLPGAW SGFLEAGKGD ASCLGPLAGL 
EKQRNQYKAA VEALADPLHT RLVLVARAQQ ATLREVARTH EELAAIGLKQ QHLVINGILP 
HVEAATDPLA AAIHEREQTA LKNIPTTLTA LPRDHVELKP FNLVGLEALR QLLTDLPPQA 
PAAVDSPIEL DEPGMADLID GIAADGHGLV MLMGKGGVGK TTLAAAIAVE LAHRGLPVHL 
TTSDPAAHLT DTLEASLDNL TVSRIDPHAE TERYRQHVLE TQGAQLDAEG RALLEEDLRS 
PCTEEIAVFQ AFSRIIREAG KKFVVMDTAP TGHTLLLLDA TGAYHREVSR QMGKTGMHFT 
TPMMQLQDPK QTKVLVVTLA ETTPVLEAAN LQADLRRAGI EPWAWIINTS VAAASAKSPL 
LRQRAANELR EISAVANQHA DRYAVVPLLK EEPIGTERLR ALIHPQA