Gene Clim_0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0966
Symbol
ID	6355415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1057977
End bp	1059170
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	49%
IMG OID	642668590
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001943021
Protein GI	189346492
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAATA TCATTTTTAC CGGAAAGGGA GGGGTCGGCA AAACCTCTGT TGCTGCAGCC 
ACGGCACTCA AAGCTGCGGA CATGGGTTAC AAGACCCTTA TTATGTCTAC CGATCCGGCT 
CACAGTCTGG GTGACTCTCT TGATGTTCAG TTAGGACCGT CTCCTGTCAA GGTGGCTGAA 
AATCTCTGGG CTCAGGAAGT CAGCGTTTTC GGCGATCTCA ATCTGAACTG GGACGTCGTC 
AGGGAGCATT TCGCACATCT GATGGCATCT CGCGGCATTG AAGGCGTCTA TGCAGAAGAG 
ATGGGTGTTC TTCCGGGTAT GGAAGAGCTT TTTTCGCTCT CCTACATCAA GCGGTATAAC 
GAGGAACAGA AAGACTACGA TCTTCTCGTT GTCGATTGCG CTCCTACCGG CGAAACCCTT 
CGCCTGCTTT CGCTGCCTGA AACATTCGGA TGGTTCATCA AGTTCATCCG CAATGTCGAG 
AAATATATGG TCAAGCCGGT TATCAGACCT CTTTCGAAAA AAATCAGAAA AATCGACGAC 
TTTGTGGCTC CTGAAGAGGT GTACGAAAAA GTCGACAATC TTTTCTCTTC AACCGAGGGC 
ATCATCGAAC TGCTTGCCGA CGGTTCGAAA TCGACGGTAC GTCTCGTCAT GAATCCCGAG 
AAGATGGTCA TCAAGGAGTC GATGCGTGCA TTGACCTACC TTAACCTCTA TGGTATCACG 
GTTGACAGCA TTACCATCAA CAGGGTTATG CCCGACCAGA GCAGCGATCC GTATTTCCAG 
AGATGGCGCG GTATTCAGCA GAAGTATATC GAGCAGATTC AGGATGCTTT CGCACCTATT 
CCGATTGCGG AAGTGCCATT GTTCGAAAAT GAGGTTGTCG GCCTCGAGAT GCTTCGCAAG 
GTTGGCGCGA AAGTCTATCC CGACCAGAAT CCTCTTGATA TCTTCTTCAA GGAAGATCCT 
ATCAATATCA CGAAGGTGTC GGAAGGTCAC TACAAGGTTC GCGTAAGGTT GCCTTTCATG 
GAAAACATGG GTATGGAACC AAAGATTCTT AAAATGGGCG ACGATCTTAC CATCCGTATC 
GGCGATTATC AGAAAATCGT GGCTCTGCCG ATTTTTCTTG CCGGCATGGA ATCCACCGGT 
GCTTCGTTCG AAGACAAATG GCTCAATATC GACTTCGCTA AAGAGGCCAA GTAG

Protein sequence

MRNIIFTGKG GVGKTSVAAA TALKAADMGY KTLIMSTDPA HSLGDSLDVQ LGPSPVKVAE 
NLWAQEVSVF GDLNLNWDVV REHFAHLMAS RGIEGVYAEE MGVLPGMEEL FSLSYIKRYN 
EEQKDYDLLV VDCAPTGETL RLLSLPETFG WFIKFIRNVE KYMVKPVIRP LSKKIRKIDD 
FVAPEEVYEK VDNLFSSTEG IIELLADGSK STVRLVMNPE KMVIKESMRA LTYLNLYGIT 
VDSITINRVM PDQSSDPYFQ RWRGIQQKYI EQIQDAFAPI PIAEVPLFEN EVVGLEMLRK 
VGAKVYPDQN PLDIFFKEDP INITKVSEGH YKVRVRLPFM ENMGMEPKIL KMGDDLTIRI 
GDYQKIVALP IFLAGMESTG ASFEDKWLNI DFAKEAK