Gene Cpha266_2297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2297
Symbol
ID	4569401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2629745
End bp	2630899
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	46%
IMG OID	639766859
Product	arsenite-activated ATPase ArsA
Protein accession	YP_912713
Protein GI	119358069
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.680488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATTA TTCTTTACCT GGGTAAGGGC GGAGTTGGAA AAACTACCGT CTCGGCTTCA 
ACAGCAACTG CAATTGCCCG CCGCGGAGAA CGGGTGCTTA TTATGAGTAC GGATGTAGCC 
CACAGTCTTG CTGACGCTTT GGGTGTGGAA TTAAGCCCGA CTCCTCTTGA AGTAGAACAA 
AATCTGTTTG CGATGGAGGT CAATGTTCTG ACAGAAATCA GGGAGAACTG GTCTGAGCTT 
TATTCCTATT TTTCCTCCAT TCTCATGCAT GACGGCGCAA ATGAGGTCGT TGCTGAAGAA 
CTTGCCATTA TGCCGGGCAT GGAAGAGATG ATCAGTCTCC GATATATATG GAAAGCTGCC 
AAGTCCGGAA ATTATGATGT TGTGGTTGTT GACGCAGCTC CGACAGGTGA AACCATGCGC 
CTGCTTGGCA TGCCGGAATC CTATGGATGG TATTCCGAGA AAATCGGTGG ATGGCACTCT 
AAAGCCATTG GCTTTGCTGC GCCGCTGCTG TCGAAATTCA TGCCTAAAAA GAATATTTTC 
AAGTTGATGC CTGAGGTGAA CGAGCATATG AAAGAGCTGC ACACCATGCT GCAGGACAAA 
AACATCACCA CGTTCAGAGT TGTCCTCAAC CCTGAGAACA TGGTGATCAA GGAAGCTCTT 
CGAGTTCAGA CCTATCTGAA TCTTTTCGGT TACAAGCTCG ATGCCGCCAT AGTCAACAAG 
GTTCTTCCTG AAAGCTCATC AGACCAGTAT CTGCAATGCC TTATTGACCT GCAGGCCAAG 
TATCTGAAGG TTATTGAAAA CTGTTTTTTC CCTGTTCCGA TTTTCAGGGC AAAACAGTCC 
ACGGCTGAGG TTATCACCCC GGACAGGCTT TATGAACTGA GTCAGGAGAT TTTTGCTGAT 
CAGAATCCTT CAGCGGTGCT TTACAGCAAT GAAAAGACCC AGACGCTTGA GAAAATAAAC 
GGCAAATACG TTCTGAGCCT CTATCTGCCT AATGTAGAGG TGACAAAGCT GAATGTCAAT 
ATCAAGGGAG ATGAATTACT GATTGACATC AACAATTTCC GTAAAAGCAT TATTTTGCCC 
AATGTTCTCG TTGGAAGAAA AACGGAGGGG GCCGACTTTG TTTCCGGAAA CCTCAATATA 
ACCTTTGCAA ACTGA

Protein sequence

MRIILYLGKG GVGKTTVSAS TATAIARRGE RVLIMSTDVA HSLADALGVE LSPTPLEVEQ 
NLFAMEVNVL TEIRENWSEL YSYFSSILMH DGANEVVAEE LAIMPGMEEM ISLRYIWKAA 
KSGNYDVVVV DAAPTGETMR LLGMPESYGW YSEKIGGWHS KAIGFAAPLL SKFMPKKNIF 
KLMPEVNEHM KELHTMLQDK NITTFRVVLN PENMVIKEAL RVQTYLNLFG YKLDAAIVNK 
VLPESSSDQY LQCLIDLQAK YLKVIENCFF PVPIFRAKQS TAEVITPDRL YELSQEIFAD 
QNPSAVLYSN EKTQTLEKIN GKYVLSLYLP NVEVTKLNVN IKGDELLIDI NNFRKSIILP 
NVLVGRKTEG ADFVSGNLNI TFAN