Gene Csal_2005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2005
Symbol
ID	4027089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2264396
End bp	2265337
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	69%
IMG OID	637967200
Product	arsenite-activated ATPase (arsA)
Protein accession	YP_574055
Protein GI	92114127
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.41819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAGA GCCTTTTCTT CGGCGGCAAG GGCGGGGTCG GCAAGACCAG CTGCGCCACC 
GCCTACGCGC TTGGCTGCGC GGCGGCCGGC TGGCGCACCC TGCTGGTCTC CACGGACCCG 
GCGCACAATC TGGCCGATCT GTTCGGACGC GCGCCGGGGC CGACCCCCAC ACGCATGCAG 
GCCGGCCTCG ATGTCGTCGA ACTCGATCCC GACCACGAAA CGCAACGCTA CCTGGAGCAG 
GTCAAGGCCA CGCTGCGTCC TCTGGTCAGC GGCGAGCGCA GCGCGACGGT GTTTCGCCAG 
CTCGATCTGG CGCGGCACGC GCCCGGCACC GAGGAAGCCG CCCTCTTCGA TGCCCTGGTC 
GGCCTGTTGC TGGATACCGG CGAGAAGTAC GATCGGCTGA TCTTCGACAC CGCCCCCGGC 
GGGCACACGG TTCGCCTGCT GGCGCTCCCC GAGATCATGG GCGCCTGGGT GGAAGGCTTG 
ATGCAACGCC GCCGCAAGGT GCGCAGCGAC TACAAGGCGT GGCTGGGCGA CGGCGAGGTG 
GTCGACGATC CCATTCAGGA AACGCTGATG CGTCGTCGCG GACGCCTCGC CGCCGCCCGC 
GAGCACTTGA CCTGCCCTGC ACACTCGGCG GTGATCCTGG TCGCCAACCC GGAACGCCTG 
CCGGCACTGG AAACCGCGCG CACCCGCGAG CTGCTCGAAA GCCATGGCCT GCACGTCGGC 
GCCGTGGTGA TCAACAAGTG CCTGCCCGCC GAGGTCGATA GCCAATGGCT CGCCAACTGG 
CGCGAGGAAC AACGCCCCTG GATCGAACAT CTCGAGGCAT CTTTCCCCGA CCGCGAGCGC 
ATTCGCATCG ACCACCAGCC CCATGCGCCC GCGTCCTGCA ACGACCTAGC CCCTCTCCAG 
GAGGCACTGG GCCGACTCGC TCCCTGGCAT GACCACGCCT AG

Protein sequence

MAKSLFFGGK GGVGKTSCAT AYALGCAAAG WRTLLVSTDP AHNLADLFGR APGPTPTRMQ 
AGLDVVELDP DHETQRYLEQ VKATLRPLVS GERSATVFRQ LDLARHAPGT EEAALFDALV 
GLLLDTGEKY DRLIFDTAPG GHTVRLLALP EIMGAWVEGL MQRRRKVRSD YKAWLGDGEV 
VDDPIQETLM RRRGRLAAAR EHLTCPAHSA VILVANPERL PALETARTRE LLESHGLHVG 
AVVINKCLPA EVDSQWLANW REEQRPWIEH LEASFPDRER IRIDHQPHAP ASCNDLAPLQ 
EALGRLAPWH DHA