Gene Cpha266_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0213
Symbol
ID	4570594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	236076
End bp	237254
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	48%
IMG OID	639764813
Product	arsenite-activated ATPase ArsA
Protein accession	YP_910704
Protein GI	119356060
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.410604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTAA TTCTTATGAC CGGAAAAGGT GGTGTTGGAA AAACATCCAT GGCTGCAGCT 
ACCGGACTTC GGTGTGCCGA ACTTGGCTAT AAAACTCTCG TTCTCAGTAC TGATCCTGCA 
CATTCGCTGG CCGACAGTTT TGATATGGCG CTCGGTCACA ACCCCAACAG AGTCTCGAAT 
AATCTTTGGG GCGCAGAGCT CGATGTTCTC AAGGAACTCG AACAGAACTG GGGCACCGTG 
AAACGATATA TAACCGGAGT TCTTCAGGCA AGGGGTCTTG AAGGTATTCA GGCAGAAGAA 
CTTGCCATCC TTCCGGGAAT GGATGAAATT TTCGGACTGG TGAGAGTATT CCGCCACCAC 
AAGGAGGGCG ACTACGATGT GCTTATCATC GACTCAGCTC CTACCGGAAC AGCATTGCGA 
CTTTTAAGCA TTCCTGAGGT AGCCGGCTGG TATATGAGAA GACTTTACAA ACCTTTTGAA 
AAAGTCGCGC TCTATCTCAG ACCTCTTGTC GAACCGATCT TCAGACCTCT TGCCGGCTTT 
TCCTTACCAG ACAAAGAGAT GATGGATGTG CCATACGAAT TTTATGAACA AATCGACGCT 
CTCGGCAAAA TCCTTACCGA CCACGCCGTC ACATCCGTCA GACTTGTCAC CAACCCAGAA 
AAGATGGTTA TCAAGGAGTC CCTTCGCGCT CACGCCTATC TTGGTCTTTA TAACATCGCT 
GTTGATCTGG TCATTGCCAA TCGGATCATA CCGCCAGAGG TCACCGATCC CTATTTCACA 
TTCTGGAAAG AGAATCAAAC GCTCTATCGA CAAGAAATCC AGGATAACTT CGCGCCCCTT 
CCCGTCAAGG AAGTCCCACT CTATTCTCGT GAGATATGCG GCATGCAGAC CCTCGAAAAA 
CTCAAGGAGA TGCTTTACGG TAACGAAGAC CCTGCACAAG TCTATTATAA AGAGCAAACA 
TTTCAGATAA AACAGACAAC CCAAGGATTT ACTCTGGAGC TCTATATCCC CGGAATTCCA 
AAGGATCAGA TTCAGTTGGG AAAAAATGGT GACGAACTGC ACGTCCGCAT AGGTAATCAC 
CGCCGCAATA TGGTGCTTCC TCAGGCACTC GCCTCACTGA AAACTACCGG AGCGGAAATG 
GATGGAGATC ACCTCATCAT CCATTTTGTT GAACCATAA

Protein sequence

MRLILMTGKG GVGKTSMAAA TGLRCAELGY KTLVLSTDPA HSLADSFDMA LGHNPNRVSN 
NLWGAELDVL KELEQNWGTV KRYITGVLQA RGLEGIQAEE LAILPGMDEI FGLVRVFRHH 
KEGDYDVLII DSAPTGTALR LLSIPEVAGW YMRRLYKPFE KVALYLRPLV EPIFRPLAGF 
SLPDKEMMDV PYEFYEQIDA LGKILTDHAV TSVRLVTNPE KMVIKESLRA HAYLGLYNIA 
VDLVIANRII PPEVTDPYFT FWKENQTLYR QEIQDNFAPL PVKEVPLYSR EICGMQTLEK 
LKEMLYGNED PAQVYYKEQT FQIKQTTQGF TLELYIPGIP KDQIQLGKNG DELHVRIGNH 
RRNMVLPQAL ASLKTTGAEM DGDHLIIHFV EP