Gene Rcas_1570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1570
Symbol
ID	5539046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2019216
End bp	2020406
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	63%
IMG OID	640893708
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001431681
Protein GI	156741552
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.807387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGA TACTCTACCT GGGCAAGGGT GGCGTTGGCA AAACGACCAC CTCGGCGGCG 
ACTGCGGTGC GCGCCGCCGA ACTCGGCTAC CGCACGCTGG TAGTCAGCAC CGATGTGGCG 
CACAGCCTGG CTGATGCGCT CGATCATCCG TTGGGACCGC AACCGACGCA GCTTACCGAC 
CGGCTCTGGG GGCAGGAAAT TAACGTGCTC GAAGAGGTGC GGCAGCATTG GGGCGAGTTG 
CGCAACTATC TGGCAGGGTT GCTCAAACGC CGCGGCGTCA GCGATGTCGC TTCCGAAGAA 
TTGGCGATCA TCCCCGGTAT GGAAGAGGTC GTCAGCCTTC TGCACATCCG GCGACAGGCG 
CGCGAGGGCA ATTTCGACGC GGTGATCGTC GATGCGGCGC CGACCGGCGA GACCATCCGC 
CTGTTGACCA TGCCAGAGAC CTTTCAGTGG TACGCGGCGC GGGTCATGGA TTGGGACCCC 
GGCACCAAGA GCATGGCTAA ACCGCTGGTG CGCGCCCTGA TCCCGGCAAC CAACGCCTTC 
GAGACGCTCG ACCGCCTGAC AAAGGGGGTC GAGGCGCTGC GCCAGATGCT GACCGATCCC 
GACATCAGTT CGTACCGCCT GGTGGTCAAC CCGGAGCGCA TGGTCATCAA AGAAGCGCAG 
CGCGCAGCGA CGTATCTGGC GCTGTTTGGC TATCCGGTCG ATGGTGTGGT GCTCAATCGG 
GTGCTGCCAC GCAACGCAGT CGCCGGCGAA TTCATGGAAC GCCTGTATGA GATGCAGTCG 
TCGTACCGCA AAATGGTGCA CGACCTGTTC GCGCCGCTGC CGATCTGGGA AGCGCCGCAT 
TACCCGCATG ATATCCGGGG TATCAACGAT CTGTCGCAGG TTGGGCGCGA TATGTTCAAG 
GACGAAGACC CGACGAAGGT CTTCTTCCGT GGCACCACGC AGGAAATCGT GCGCGACGGC 
GATGAATATG TGATGCGTCT GCCGTTGCCG CACGTCGAAA TCGGCAAGGT GTCGATCACC 
AAACGCGGCG ACGAACTGTT CGTTGCCATC GGCAATTTCA AGCGCGATAT GATCCTGCCG 
CTGACACTCG CGGAACGACC GGCGAAGCGC GCGGTGTTCC GCGAAGGGGT GCTTGAGGTG 
CGTTTTGGCG CCCCGGAGAC GGTCGAGCCG ACTGCGGCTT CCGCAGGGTG A

Protein sequence

MRLILYLGKG GVGKTTTSAA TAVRAAELGY RTLVVSTDVA HSLADALDHP LGPQPTQLTD 
RLWGQEINVL EEVRQHWGEL RNYLAGLLKR RGVSDVASEE LAIIPGMEEV VSLLHIRRQA 
REGNFDAVIV DAAPTGETIR LLTMPETFQW YAARVMDWDP GTKSMAKPLV RALIPATNAF 
ETLDRLTKGV EALRQMLTDP DISSYRLVVN PERMVIKEAQ RAATYLALFG YPVDGVVLNR 
VLPRNAVAGE FMERLYEMQS SYRKMVHDLF APLPIWEAPH YPHDIRGIND LSQVGRDMFK 
DEDPTKVFFR GTTQEIVRDG DEYVMRLPLP HVEIGKVSIT KRGDELFVAI GNFKRDMILP 
LTLAERPAKR AVFREGVLEV RFGAPETVEP TAASAG