Gene Clim_0551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0551
Symbol
ID	6354902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	621591
End bp	622892
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	50%
IMG OID	642668187
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001942622
Protein GI	189346093
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGTCGA GAGACTTAAC GGAAAACCAG TCTCAGCCGA GAGTCATAAT CTATTCAGGA 
AAGGGCGGAA CGGGTAAAAC CACGATATCC TCTTCGACGG CAGTAGCTCT TGCCCGGCAG 
AACAAGAAGG TTCTCATCAT GTCTTCTGAT CCTGCCCATT CGCTTTCCGA TGTTTTCAAT 
ACGCAGATCA GCCGTAACGA ACCGCAGAAA ATCGAAAACA ATCTCTATGG TCTCGAGGTC 
GATACGATCT ATGAGCTGAA AAAAAACATG TCCGGCTTCC AGAAGTTCGT TTCCTCTTCC 
TACCAGAACA AGGGAATCGA CAGCGGCATG GCTACCGAAC TTACCACGCA GCCCGGCCTC 
GACGAGATTT TCGCACTCAG CCGCCTGGTC GATGAGGCGC AGTCGGGCAA ATGGGACGCC 
CTGGTGCTCG ATACTTCGCC GACCGGCAAC ACCCTGAGAC TGCTTGCCTA TCCGGAAATC 
ATCATTGGCG GTAATATGGG CAAACAGTTC TTCAAGCTTT ACAAGAGCAT GTCGTCACTG 
GCCCGTCCCC TGAGCGGCAA CTCCATACCC GATGAGGACT TTTTCAACGA GATCAACGTT 
CTGCTCAAGC AGATGGAAGA TATCAACAAG TTCATTCTCA GCCCGGAGGT TACCTTCCGT 
CTGGTGCTGA ACCCCGAGAA GCTTTCCATT CTTGAAACAA AGCGTGCCTA CACCTTCGTG 
CACCTTTACG GCATCAATAT CGACGGTATC GTCATCAACA AAATTCTGCC GACCTCGCGT 
ACCGTGGGAG AGTATTTTGA GTTCTGGAGC GAGCTGCACA GCAAATATCT GATGGAGATC 
GACAACTCCT TCTATCCTAC TCCCGTGTTT CGCTGCAATT TGCAGCGGAC CGAGCCGATC 
GGGCCTGACG CGCTCCATGA GATCAGCAAG CTGGTGTTCG GCGAGGAAGT TCCGGATAAA 
ATTTTCTACT CCGGAAAGAA TTTCTGGATC GAGACCCGCA AGAATGCCGT TACGGAAGAT 
CATAGGGAAA TTCTCTGCAT CAAGATTCCG TTTCTCAAGG ATGCCGAAGA TGTAAAGGTC 
GAGCGGATGG GTACCGACAT TGCCGTTACC GTTGACCGGG CCCAGAGAGT CATTACCCTT 
CCGCGAGCGC TGTACAGCCT TGAACTCGAA AAATATATCC GCGAGGATAA CTTGCTTCGG 
GTTGTTTTCA GAGAGCTTCC TGTTGAAAAA GAGGAGGTGG AACTGAGTGT CAATAAAAAC 
ATGCTCGATA AACTTCGTTC AATGAGAAGA CTGAAGATAT AG

Protein sequence

MLSRDLTENQ SQPRVIIYSG KGGTGKTTIS SSTAVALARQ NKKVLIMSSD PAHSLSDVFN 
TQISRNEPQK IENNLYGLEV DTIYELKKNM SGFQKFVSSS YQNKGIDSGM ATELTTQPGL 
DEIFALSRLV DEAQSGKWDA LVLDTSPTGN TLRLLAYPEI IIGGNMGKQF FKLYKSMSSL 
ARPLSGNSIP DEDFFNEINV LLKQMEDINK FILSPEVTFR LVLNPEKLSI LETKRAYTFV 
HLYGINIDGI VINKILPTSR TVGEYFEFWS ELHSKYLMEI DNSFYPTPVF RCNLQRTEPI 
GPDALHEISK LVFGEEVPDK IFYSGKNFWI ETRKNAVTED HREILCIKIP FLKDAEDVKV 
ERMGTDIAVT VDRAQRVITL PRALYSLELE KYIREDNLLR VVFRELPVEK EEVELSVNKN 
MLDKLRSMRR LKI