Gene Cpha266_1088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1088
Symbol
ID	4570032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1231774
End bp	1232961
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	45%
IMG OID	639765685
Product	arsenite-activated ATPase ArsA
Protein accession	YP_911553
Protein GI	119356909
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.782242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAATA TCATTTTTAC CGGAAAGGGA GGCGTCGGCA AAACCTCTGT AGCTGCCGCA 
ACAGCACTGA GGGCGGCAGA AATGGGTTAT AAGACCCTTA TAATGTCTAC TGATCCGGCG 
CACAGTCTGG GTGACTCGCT TGATGTTCAG TTAGGCCCAT CTCCAGTCAA GGTTGCTGAA 
AATCTCTGGG GCCAGGAGGT CAGTGTTTTC GGTGATCTTA ATCTTAACTG GGATGTAGTC 
AGGGAGCATT TTGCGCATTT GATGGCATCT CGCGGTATCG AGGGTGTGTA TGCAGAGGAA 
ATGGGCGTTC TTCCTGGTAT GGAAGAGCTC TTTTCGCTCT CCTATATCAA ACGGTACAAT 
GAAGGAAATC AGGATTACGA TCTTCTTGTC GTCGATTGTG CTCCTACCGG CGAAACGCTT 
CGTCTGCTTT CGCTTCCGGA AACCTTCGGA TGGTTTATCA AGTTTATCCG TAATGTCGAA 
AAGTATATGG TGAAACCGGT TATCAGACCG CTTTCAAAGA AAATCAAGAA AATTGATGAT 
TTTGTCGCTC CTGAAGAGGT CTATGAAAAG GTTGATAATC TTTTCTCTTC CACGGAAGGC 
ATTATTGATC TTCTTGCAGA TGGCACGAAA TCCACGGTGC GTCTTGTCAT GAACCCCGAG 
AAGATGGTTA TCAAAGAGTC CATGCGCGCG TTAACCTATC TCAATCTCTA TGGAATAACC 
GTTGACAGTA TTACCATCAA CAGGATTATG CCCGATCATA CCGAGGATCC TTACTTTAAA 
AAATGGAGAG CTATTCAGCA GAAGTATATT GAGCAGATTA AAGGAGCATT TTCTCCGATT 
CCGATTGCTG AAGTGCCTTT GTTTGATGAA GAGGTTGTTG GTCTCGATAT GCTTCGCAAG 
GTTGGAGAAA AGGTTTATGC GGGTAAAAAT CCGCTTGACA TTTTCTTCAA GGAAGATCCT 
ATTGATATCA AGAAGGTTGC TGATGGACAC TATAAGGTAC GCGTAAGGCT TCCATTCATG 
GAAACAATGG GTATGGAACC AAAGATTCTT AAACTGGGTG ATGATTTGAC CATTCGCATC 
GGCGATTATC AGAAAATCGT TGCCTTGCCG ATTTTCCTTG CCGGTCTTGA ATCAACGGGC 
GCCACGTTTG AAGAAAAATG GCTGAGCATT GACTTTACAA AGCCATGA

Protein sequence

MRNIIFTGKG GVGKTSVAAA TALRAAEMGY KTLIMSTDPA HSLGDSLDVQ LGPSPVKVAE 
NLWGQEVSVF GDLNLNWDVV REHFAHLMAS RGIEGVYAEE MGVLPGMEEL FSLSYIKRYN 
EGNQDYDLLV VDCAPTGETL RLLSLPETFG WFIKFIRNVE KYMVKPVIRP LSKKIKKIDD 
FVAPEEVYEK VDNLFSSTEG IIDLLADGTK STVRLVMNPE KMVIKESMRA LTYLNLYGIT 
VDSITINRIM PDHTEDPYFK KWRAIQQKYI EQIKGAFSPI PIAEVPLFDE EVVGLDMLRK 
VGEKVYAGKN PLDIFFKEDP IDIKKVADGH YKVRVRLPFM ETMGMEPKIL KLGDDLTIRI 
GDYQKIVALP IFLAGLESTG ATFEEKWLSI DFTKP