Gene Clim_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2147
Symbol
ID	6355941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2365798
End bp	2367015
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	48%
IMG OID	642669738
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001944150
Protein GI	189347621
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.686862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTT TAACATTTAC AGGTAAAGGC GGAGTGGGTA AAACCAGCGT GTCAGCTGCA 
ACCGCTGTCC GTTTATCCGA GTTGGGCCAT CGCACCCTTG TTCTTTCAAC CGATCCGGCT 
CACAGTCTGT CGGATTCATT CAATCTCGCT CTCGGTGCCG AACCAACCAA AATCAAGGAG 
AACCTGCATG CCATCGAGGT TAATCCTTAT GTTGATCTGA AGCAGAACTG GCAGTCAGTT 
CAGAAATACT ATACGAGAAT TTTTATGGCT CAGGGCGTTT CAGGCGTCAT GGCCGATGAG 
ATGACCATTC TTCCCGGCAT GGAAGAACTG TTTTCTCTCC TGCGAATCAA ACGGTATAAA 
ACCGCCGGAC TGTACGATGC GCTTGTACTC GATACCGCTC CGACCGGTGA GACCCTTCGC 
CTTCTCTCTC TGCCCGATAC GCTTTCGTGG GGCATGAAAG CCGTTAAAAA TGTCAATAAA 
TATATAGTCA GGCCGCTCAG CAAACCGCTG TCGAAAATGT CCGACAGGAT TGCTTACTAC 
ATTCCACCCG AAGACGCTAT CGAATCGGTC GATCAGGTGT TCGACGAACT TGAGGATATT 
CGGGAAATTC TTACCGATAA TGTTAAATCG ACCGTTCGGC TTGTCATGAA CGCCGAGAAA 
ATGTCGATCA AGGAGACCAT GAGGGCTCTC ACCTATCTGA ACCTTTACGG CTTCAAGGTC 
GATATGGTTT TGGTGAACAG GCTGCTCGAT ACCAACGAAA ACAGCGGATA CCTTGAAAAA 
TGGAAGGGTA TCCAGCAGAA ATATCTTGGT GAAATAGAAG AAGGGTTTTC TCCGCTTCCG 
GTCAAGAAAC TGAAAATGTA CGAGCAGGAA ATCGTCGGGT TGAAGGCTCT GGAAATGTTT 
GCCCGCGATA TGTACGGAGA TACCGATCCC GCAGATCTCA TGTACAACGA GCCGCCGATC 
AAATTTGTTC GGAACGGTGA TATTTATGAA GTGCAGCTGA AACTCATGTT CGCCAACCCG 
GTCGATATCG ACGTCTGGGT TACCGGCGAT GAGCTTTATG TACAGATCGG CAATCAGCGT 
AAAATCATTA CGTTACCGAT CAGCCTTACA GGACTCGAGC CAGGTGATGC GGTCTTCAAG 
GATAAATGGC TCCACATCCC GTTCGATCTC AACCATCAGG GCAAGCATCA GAATCAGAAA 
GAGTTTAACA AAGTGTGA

Protein sequence

MRILTFTGKG GVGKTSVSAA TAVRLSELGH RTLVLSTDPA HSLSDSFNLA LGAEPTKIKE 
NLHAIEVNPY VDLKQNWQSV QKYYTRIFMA QGVSGVMADE MTILPGMEEL FSLLRIKRYK 
TAGLYDALVL DTAPTGETLR LLSLPDTLSW GMKAVKNVNK YIVRPLSKPL SKMSDRIAYY 
IPPEDAIESV DQVFDELEDI REILTDNVKS TVRLVMNAEK MSIKETMRAL TYLNLYGFKV 
DMVLVNRLLD TNENSGYLEK WKGIQQKYLG EIEEGFSPLP VKKLKMYEQE IVGLKALEMF 
ARDMYGDTDP ADLMYNEPPI KFVRNGDIYE VQLKLMFANP VDIDVWVTGD ELYVQIGNQR 
KIITLPISLT GLEPGDAVFK DKWLHIPFDL NHQGKHQNQK EFNKV