Gene Acid345_2410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2410
Symbol
ID	4071408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2850547
End bp	2852451
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	61%
IMG OID	637984426
Product	arsenite-transporting ATPase
Protein accession	YP_591485
Protein GI	94969437
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAAGTT TCACATTCGT GATCGGAAAA GGCGGCGTCG GCAAGACGAC CGTAGCGGCG 
TCGCTTGCGC TGCACACGGC GAACACACAC CCGCGCGCGA AGACGCTGCT GCTCTCGACC 
GATCCTGCAC ACTCGCTCGC CGATGTGCTT GAAACCAAGC TCGGCGATAC TCCAAAAAAA 
CTGAAAGCCA AAGGTGCGTT GTACGCCCGG GAACTCGATG CCTCGGCGGC AGTCGAAGAG 
TTTCTCGCCG CGCAGCGTGA AGGCATTCTA CGTATCCTTG AGAGCGGATC TTTGTTCACG 
CGCGACGAGA TCGCGCCACT GCTCGACAGC GCTCTGCCCG GAATGGCGGA AGTCGCGGCG 
CTGCTGGCGA TCCACGACCT GCTCGAATCC GATTACGACG AAGTGATCGT AGATACGGCG 
CCCATGGGCC ACACCCTGCG CCTATTCGAA CTCCCAGCGC ACCTGGAGCG CTTCTTGCAC 
TTACTGGAAG TCTCCGCCGG TCGCGATGCA GTGCTGGCAG CCCACTTCGG CGGAAGCGTA 
AGCGAGAACC AGTACGTCGC GCGCTGGCAG GAAATGGTGC GAAAAGTGGC GCAGTCGCTG 
GATCACGAAC ACGCGCGATT GCTCCTGGTG ACGTCGTCGG AAAAGTTTTC GTTGAATGAG 
GCCATTCGCG CGCGGGAGCA GCTTCAGCGA GCGCCGGTTC CGATGGAGAT CGCAGAGATC 
GTGCTGAACC GAGCTGTAAC TGCGGTTTCC GGCTGCAAGC GATGTACAAC GGCGGCGAAG 
AAAACGGTGG CAGCGAGACG GTTTCTCGCG AAGGAATTCA AGCGCGTACC GCTGCGGACA 
GGCGAAGACC CAGGCAGCCC AATCGCAGGC GTCGACGCGC TGACGGCATT CGGCAAGCAT 
GTATTCGAGG GAAGGGCGCT GCGGCTAAAG CAGTCGAAGC CCGTGCGCGA AAAGGCACTC 
GATATCGAAG AAGCGCAGTG GCCCGTACTC AACACCCCGC TGACTCTCAC GCTAGGCAAA 
GGCGGTGTCG GCAAGACGAC CATCTCTGCG GCAATGGCCT TTCACGCCCG TGCAAAAAAT 
GCGAAGGAAG CAGTGTGCAT CTGCTCAATC GATCCCGCGC CGTCACTCGA TGACGTCTTC 
CAAACCGAAG TCACGAACCA ACTAGCTCCG GTGTTAGACG ACGCCAAACT CTTCGCTGCG 
GAAATCGATG CAGTTGGGGA GTATCAGCGC TGGGCGGAAG AGATGCGCGC AAGGGTCGAA 
GACGCTACTT CGACCGAAGT CCGCGGCGTG CATCTCGATC TCAGCTTCGA GCGCGACCTC 
TTCCTGGCAA TTCTCGACGT GGTGCCGCCC GGCGTGGACG AACTCTTCGC GACCTTTCGC 
ATCCTCGACC TCGTAGAACG CGGCGGTCGG GTGCAGATTG ACATGGCGCC CACCGGCCAC 
GCCTTGGAAG TATTGCGCAC CCCGGCACGG CTATTGGGTT GGGCGCGGGT TTTGTTGAAA 
ACCCTCGCGC ACCACCGTAC ACTACCCCTC GCGCGCGATG CGGCCGTGGA GATTGCGACA 
GTCTCGCAAC GAGTGCGCGA ACTTTCGACA ACGCTCAGCG ATTCCAAACG CAGTCAGGTG 
TGGGTGGTCA TGCTGGCAGA ACCGCTGCCG GACCGGGAGA CGCGTCGCTT GCTGTGCGAT 
TTGCAGGAAT TGAAAGCGCC GGTGGCGGGA GTTTTCGTCA ACCGCGTCTT GATGGACGAG 
ACCCACTGCC CGCGCTGTAG CCGCGCACAG GCGTGGCAGC GGCAAACGCT GGCGAAGATG 
AAAGACGGCG CTTTCCCGGT ATTTGTCGTG CCGGAGATGC CAGAGGAAAT CGCAGGAGCG 
CGCGGGCTGC AACGGTTCAC CAAATCTCTA TGGCGACTGC AATAA

Protein sequence

MPSFTFVIGK GGVGKTTVAA SLALHTANTH PRAKTLLLST DPAHSLADVL ETKLGDTPKK 
LKAKGALYAR ELDASAAVEE FLAAQREGIL RILESGSLFT RDEIAPLLDS ALPGMAEVAA 
LLAIHDLLES DYDEVIVDTA PMGHTLRLFE LPAHLERFLH LLEVSAGRDA VLAAHFGGSV 
SENQYVARWQ EMVRKVAQSL DHEHARLLLV TSSEKFSLNE AIRAREQLQR APVPMEIAEI 
VLNRAVTAVS GCKRCTTAAK KTVAARRFLA KEFKRVPLRT GEDPGSPIAG VDALTAFGKH 
VFEGRALRLK QSKPVREKAL DIEEAQWPVL NTPLTLTLGK GGVGKTTISA AMAFHARAKN 
AKEAVCICSI DPAPSLDDVF QTEVTNQLAP VLDDAKLFAA EIDAVGEYQR WAEEMRARVE 
DATSTEVRGV HLDLSFERDL FLAILDVVPP GVDELFATFR ILDLVERGGR VQIDMAPTGH 
ALEVLRTPAR LLGWARVLLK TLAHHRTLPL ARDAAVEIAT VSQRVRELST TLSDSKRSQV 
WVVMLAEPLP DRETRRLLCD LQELKAPVAG VFVNRVLMDE THCPRCSRAQ AWQRQTLAKM 
KDGAFPVFVV PEMPEEIAGA RGLQRFTKSL WRLQ