Gene Cphamn1_0091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0091
Symbol
ID	6373734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	85202
End bp	86410
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	49%
IMG OID	642682607
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001958555
Protein GI	189499085
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.304953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAACA TAGTCTATAC CGGAAAAGGC GGCGTCGGCA AAACCACAAT CGCAGCAGCT 
ACGGCGTTGA AAGCCGCCAC AATGGGCTAC AAAACGCTTG TTATCTCTAC AGACCCGGCG 
CACAGCCTGG GTGACTCATT CGACAGAGAG CTCGGATCGT CACCTGTAGC GATCGCAGAC 
AATCTTTACG GTCAGGAGGT CAGTGTCTAT GGCGACCTGT CGCTTAACTG GGAAATAGTA 
CGTGAGCATT TCGCCCACCT GATGGAAGTC CAGGGGATCA AGGGCATCTA CGTCGAAGAG 
ATGGGGGTTC TGCCCGGCAT GGAAGAACTT TTTTCGCTTT CCTACATCAA GAAGTACAAC 
GAATCAGATG ATTATGACCT TCTGGTGGTA GATTGTGCTC CCACAGGGGA AACCCTGCGC 
CTGCTCTCTA TCCCTGAAAC CTTCGGCTGG ATGCTCAAGC TCATGCGGAA CATGGAAAAG 
TACGTTGTAA AACCGCTTAT CCGCCCTATA TCCAAGCGTG TCGGCAAACT GCACGATGTC 
GTCCCTGAAG AGGATGTCTA TAATCAGGTT GATCATCTCT TTTCCTCTGT CGAGGGAATC 
ATCGATCTTC TTTCAGACGG CAGCAAAACA ACTGTCCGTC TGGTTATGAA TCCGGAGAAA 
ATGGTCTTAA AGGAAACCAT GCGTGCCCTG ACCTACCTCA ACCTCTACGG GATAACGGTT 
GACCAGATAG TGGTAAACCG CGTTCTTCTC GATGAGGTTG ACGGGAAGTT CCTGAGTGAA 
TGGAAAGAGA TACAGAAAAA ATATCTGGAT CAGATCGACA GGACTTTTTC GCCGATACCG 
ATCATACAGG TACCCTTTTT CAGACAGGAA GTCGTTGGCC TCGACATGCT GGAAAAAGTG 
GGGGAAATAG TCTACAGAGA TTCCGACCCG CTTGATATCC TCTACCGTGA AGAGCATGTC 
AACATCAAAA AACAGGATGA AGGTCACTAC ATCATGAAAC TGCGCGCCCC GTTTATCTTC 
GATAACAACA TGGAAGCCAA TATCGTGCAG GTAGGGGAAT TGATGACCGT ACGCATCGGG 
AACTACCAGA AAGGCGTTAT ACTCCCCGCC TTTCTTGCCG GACTCCGTGT CAGCAGCGCA 
AACTATAAAG AGAAATGGCT TGTCGTTGAA TTCAAAAAGA AGGAAAAAGA CGCAACGAAG 
TCTGAATGA

Protein sequence

MRNIVYTGKG GVGKTTIAAA TALKAATMGY KTLVISTDPA HSLGDSFDRE LGSSPVAIAD 
NLYGQEVSVY GDLSLNWEIV REHFAHLMEV QGIKGIYVEE MGVLPGMEEL FSLSYIKKYN 
ESDDYDLLVV DCAPTGETLR LLSIPETFGW MLKLMRNMEK YVVKPLIRPI SKRVGKLHDV 
VPEEDVYNQV DHLFSSVEGI IDLLSDGSKT TVRLVMNPEK MVLKETMRAL TYLNLYGITV 
DQIVVNRVLL DEVDGKFLSE WKEIQKKYLD QIDRTFSPIP IIQVPFFRQE VVGLDMLEKV 
GEIVYRDSDP LDILYREEHV NIKKQDEGHY IMKLRAPFIF DNNMEANIVQ VGELMTVRIG 
NYQKGVILPA FLAGLRVSSA NYKEKWLVVE FKKKEKDATK SE