Gene Cphamn1_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_2198
Symbol
ID	6375892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2376650
End bp	2377867
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	46%
IMG OID	642684685
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001960584
Protein GI	189501114
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.416717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCT TAACATTTAC CGGAAAAGGT GGAGTTGGCA AGACAAGCGT TTCCGCTGCG 
ACAGCCGTCC GTTTGTCGCA AATGGGATAT CGTACGCTGG TATTATCCAC TGATCCTGCT 
CACAGTCTAT CGGACTCTTT TAATATCTCA TTAGGGCCTG AACCAACCAA GATCAAGGAG 
AACCTGCATG CCATCGAAGT GAATCCATAT GTTGATTTAA AGGAGAACTG GCAGGCTGTT 
CAGAAGTATT ATACAAGGGT ATTCGCCGCA CAAGGTGTTT CAGGAGTGGT CGCTGATGAG 
ATGACGATCC TGCCAGGCAT GGAAGAACTG TTTTCGCTTT TGAGAATAAA ACGCTACAAG 
TCTTCGGGGC TATACGATGT ACTTGTGCTC GATACCGCTC CGACCGGTGA AACGCTTCGG 
CTTCTTTCTC TTCCCGATAC CCTTTCATGG GGTATGAAGG CGGTAAAGAA TGTCAATAAA 
TATATCATGA AGCCGCTCAG CAAGCCGCTT GCAAAGATGT CTGACAAGAT AGCCTACTAT 
ATTCCTCCTG AAGATGCGAT TGATTCTGTC GATCAGGTTT TTGACGAGCT TGAAGATATC 
AGAGAGATTC TTACCAACAA CAAGAACTCT ACCGTGAGAC TTGTTATGAA CGCGGAAAAG 
ATGTCTATCA AGGAGACCAT GCGGGCACTT ACCTATCTGA ATCTCTATGG ATTCAATGTG 
GATATGGTTC TTGTGAACAG ACTGCTGGAT GTCAAGGAAG ACAGCGGATA TCTTGAGAAA 
TGGAAATCTA TTCAGCAGAA ATATCTTCTT GAGATCGAGA GCGGATTTAC ACCTCTGCCT 
GTAAAACGTC TCAAGATGTA CGATCAGGAA ATTGTCGGGT TGCCGGCCCT CGATGTTTTT 
GCCAAAGACA TGTATGGGGA TTCAGACCCC TCTCAGCTTA TGTTCGATGA GCCTCCGATC 
AAGTTCGAAA GGAGTGGTGA CACCTATGAG GTTCAATTGA AGCTTATGTT CGCCAATCCG 
GTTGATATCG ATGTCTGGGT TACCGGAGAT GAACTTTTCG TTCAGATAGG AAATCAGAGG 
AAAATAATCA CGCTTCCGAT CAGTCTTACC GGGCTTGAGC CGGGAGATGC CGTATTCAAG 
GACAAGTGGC TGCATATACC GTTTGACCTC AACAAGCAGA AAGAACATCA GAGAGAAAAG 
GAATACAACA GGGCTTGA

Protein sequence

MRILTFTGKG GVGKTSVSAA TAVRLSQMGY RTLVLSTDPA HSLSDSFNIS LGPEPTKIKE 
NLHAIEVNPY VDLKENWQAV QKYYTRVFAA QGVSGVVADE MTILPGMEEL FSLLRIKRYK 
SSGLYDVLVL DTAPTGETLR LLSLPDTLSW GMKAVKNVNK YIMKPLSKPL AKMSDKIAYY 
IPPEDAIDSV DQVFDELEDI REILTNNKNS TVRLVMNAEK MSIKETMRAL TYLNLYGFNV 
DMVLVNRLLD VKEDSGYLEK WKSIQQKYLL EIESGFTPLP VKRLKMYDQE IVGLPALDVF 
AKDMYGDSDP SQLMFDEPPI KFERSGDTYE VQLKLMFANP VDIDVWVTGD ELFVQIGNQR 
KIITLPISLT GLEPGDAVFK DKWLHIPFDL NKQKEHQREK EYNRA