Gene Cphamn1_0797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0797
Symbol
ID	6374464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	853310
End bp	854611
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	46%
IMG OID	642683305
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001959229
Protein GI	189499759
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.541359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGTCGA GGGAGCTCGA AGAAGGTCAG TCAAATCCAC GGGTGATTAT CTATTCAGGT 
AAGGGAGGGA CGGGTAAAAC CACGATCTCT TCATCCACTG CCGTTGCGCT CGCGAGAAAG 
AACAAGCGCG TGCTTATTAT GTCATCCGAC CCGGCTCATT CACTTTCGGA TGTATTCAAT 
ACCTCTATAA GTCGGAACGA ACCGCAGAAG ATCGAAAAAA ACCTCTACGG CCTTGAGGTT 
GACACGATCC ATGAGTTGAA GAAAAACATG TCCGGATTTC AGAAGTTTGT CTCTTCGTCC 
TACCAGAATC GTGGTATAGA CAGCGGCATG GCTTCTGAGC TGACGACTCA GCCGGGGCTT 
GATGAGATCT TCGCGTTGAG CAGGCTGGTA GATGAGGCAC AGTCAGGGAA ATGGGACGTC 
GTTGTTCTCG ATACTTCACC GACCGGTAAT ACGCTGAGGC TGCTTGCCTA CCCGGAGATT 
ATCATCGGGG GCAATATGGG CAAACAGTTT TTCAAGCTCT ACAAGAGCAT GTCCTCTCTG 
GCTCGCCCTA TGGGCAAGAA CTCAATTCCG GATGAAGAGT TTTTCAACGA GGTAAATGTC 
CTCTTGAAGC AAATGGAGGA TATCAACAAA TTTATTCTCA GTCCTGAAGT CACGTTCAGG 
CTGGTTCTGA ACCCTGAAAA ACTTTCGATT CTCGAGACAA AGCGTGCGTA TACCTTTGTT 
CATCTGTATG GAATCAATAT TGACGGTATC GTTATCAACA AGATTTTGCC GACATCAAAG 
ACGGTAGGAG AGTATTTCGA ATTCTGGGCT GATCTGCACA GCAAATATCT CATGGAGATC 
GATAACTCAT TTTATCCTAC ACCGGTTTTT CGATGTCAAC TGCAGCGGAC GGAGCCTATC 
GGCCCTGACG CGCTGCATGA GGTCAGTCAT CTGGTGTTTG GTGATCAGTC TCCGGACAAG 
ATTTATTATT CGGGCAAGAA TTTCTGGATA GAATCAAAAA AAAGTTCGCA CGACCAGGAG 
CATCTTGAAA TTCTTTGTAT CCGGATTCCA TTCCTCAAGG AGGCTGAAAC TGTTGAAGTG 
AATCGTATGG GGACCGATAT CGTTGTCACG GTTGATCGTG CTCAGCGTAT CATAACCCTC 
CCAAGGGCGC TGTACAGCCT TGAAATGGAA AAATATGTCA GGGAGGATGA TCAGTTGAAA 
ATATTGTTCA AAGAGGTCCC TGTCGAAAAA GAAGAAATGG AATTGAACGT CAACAAGAAC 
GTGCTGAACA AGCTTCGTTC TTTGAGGAAA ATGAAATTCT AA

Protein sequence

MLSRELEEGQ SNPRVIIYSG KGGTGKTTIS SSTAVALARK NKRVLIMSSD PAHSLSDVFN 
TSISRNEPQK IEKNLYGLEV DTIHELKKNM SGFQKFVSSS YQNRGIDSGM ASELTTQPGL 
DEIFALSRLV DEAQSGKWDV VVLDTSPTGN TLRLLAYPEI IIGGNMGKQF FKLYKSMSSL 
ARPMGKNSIP DEEFFNEVNV LLKQMEDINK FILSPEVTFR LVLNPEKLSI LETKRAYTFV 
HLYGINIDGI VINKILPTSK TVGEYFEFWA DLHSKYLMEI DNSFYPTPVF RCQLQRTEPI 
GPDALHEVSH LVFGDQSPDK IYYSGKNFWI ESKKSSHDQE HLEILCIRIP FLKEAETVEV 
NRMGTDIVVT VDRAQRIITL PRALYSLEME KYVREDDQLK ILFKEVPVEK EEMELNVNKN 
VLNKLRSLRK MKF