Gene Clim_2143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2143
Symbol
ID	6355937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2361630
End bp	2362784
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	49%
IMG OID	642669734
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001944146
Protein GI	189347617
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.237468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTA TTCTTTATCT AGGGAAGGGA GGGGTTGGAA AAACCACCGT CTCAGCTTCA 
ACGGCAACTG CAATTGCCCG TCGTGGAGAG CGTGTGCTGA TTATGAGCAC CGATGTGGCC 
CACAGCCTTG CTGATGCGTT CAGCGTGGAA TTAAGCCAGA ATCCGATCGA GGTAGAAAAA 
AACCTTTTTG CCATGGAGGT AAATGTTCTT GCTGAAATCA GGGAGAACTG GACGGAACTC 
TATTCCTATT TTTCGTCGAT TCTTATGCAT GACGGGGCCA ATGAGGTCGT GGCTGAAGAG 
CTTGCCATCG TGCCGGGCAT GGAAGAGATG ATCAGTCTTC GTTACATCTG GAAAGCAGCA 
AAGTCAGGCA ACTACGATGT CATTATTGTC GATGCCGCAC CGACAGGCGA AACCATGCGT 
TTGCTGGGTA TGCCGGAATC CTACGGCTGG TACTCCGACA AGATAGGCGG CTGGCATTCA 
AAGGCAATAG GCTTTGCCGC TCCTCTGCTT TCAAAGTTCA TGCCGAAAAA GAATATCTTC 
AAGCTGATGC CTGAGGTGAA CGAGCATATG AAAGAGTTGC ACGGCATGCT TCAGGATCAG 
ACCGTCACCA CTTTCCGCGT TGTGCTCAAT CCCGAGAACA TGGTCATCAA GGAGGCTCTT 
CGCGTGCAGA CCTATCTGAA TCTGTTCGGG TATAAGCTCG ATGCAGCCGT GGTCAACAAA 
ATTCTTCCCG AAAGCTCCGC CGATCAGTAT CTGCAGAGCC TTATCGACAT TCAGCAGAAA 
TATCTCCGGG TCATCGACAA CTGTTTCTAT CCGGTACCGA TTTTCCGGGC TCATCAGCAG 
ACAGCCGAGG TGATCAACAC CGATCGTCTT CATGTGCTGA GTCAGGAGAT TTTCGGCGAT 
AAAAATCCCT CTGCCGTTCT CTACAGCAAC GACAAGACTC AGACTCTCGA AAAAATCAAC 
GGAAAATATG TGCTCAGTCT CTATCTTCCG AATGTCGAGG TCAAGAAGCT CAATGTCAAC 
ATCAAGGGAG ATGAACTGCT CGTCGATATC AATAATTTCC GCAAAAGCAT TATTCTTCCG 
AATGTGCTTG TCGGCAGAAA AACCGAAGGA GCCGATTTTG CCGCCGGTAA CCTGAACATC 
ACTTTTGCCA ACTGA

Protein sequence

MRIILYLGKG GVGKTTVSAS TATAIARRGE RVLIMSTDVA HSLADAFSVE LSQNPIEVEK 
NLFAMEVNVL AEIRENWTEL YSYFSSILMH DGANEVVAEE LAIVPGMEEM ISLRYIWKAA 
KSGNYDVIIV DAAPTGETMR LLGMPESYGW YSDKIGGWHS KAIGFAAPLL SKFMPKKNIF 
KLMPEVNEHM KELHGMLQDQ TVTTFRVVLN PENMVIKEAL RVQTYLNLFG YKLDAAVVNK 
ILPESSADQY LQSLIDIQQK YLRVIDNCFY PVPIFRAHQQ TAEVINTDRL HVLSQEIFGD 
KNPSAVLYSN DKTQTLEKIN GKYVLSLYLP NVEVKKLNVN IKGDELLVDI NNFRKSIILP 
NVLVGRKTEG ADFAAGNLNI TFAN