Gene Clim_2364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2364
Symbol
ID	6355710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2592454
End bp	2593641
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	47%
IMG OID	642669956
Product	arsenite-activated ATPase ArsA
Protein accession	YP_001944366
Protein GI	189347837
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCTTA TTCTCATGAC AGGGAAGGGT GGTGTCGGAA AAACATCCAT GGCGGCGGCT 
ACCGGCTTGC GCTGTGCAGA GCTTGGTTAT AAAACGCTTG TCCTGAGTAC CGATCCCGCT 
CATTCGCTTG CCGACAGTTT CGATATCCCC CTGGGCCATG AAGCGGTAAA GATATGCGAT 
AATCTTTATG GCGCTGAACT TGATGTGCTT CAGGAGCTTG AACAGAACTG GGGGACGGTC 
AAACGCTATA TTACCCAGGT ATTGCAGGCA AGAGGTCTTG ATGCTGTTCA GGCAGAAGAG 
CTTGCCATTC TTCCCGGGAT GGATGAGATT TTCGGGCTCG TCAGGGTATT CCGACATCAC 
AGGGAGGGGA ATTACGATGT GTTGATCATC GACTCGGCTC CTACAGGAAC AGCATTGCGC 
CTTTTGAGTA TTCCTGAAGT CAGCGGCTGG TATATGCGCA GACTCTACAA GCCGATGGAG 
AAGTTTGCGC TGTATCTCAG GCCGCTCGTC GAACCACTTT TCCGGCCTAT TGCCGGATTT 
TCGCTTCCTG ACAGAGCGTT AATGAATGTC CCATACGAAT TCTACGAACA AATTGATGCG 
CTTGGAAAGA TTCTCACGGA CAATGCCATT ACCTCTGTGC GGCTGGTGAC CAATCCGGAA 
AAAATGGTTA TCAAGGAGTC GCTGCGCGCT CATGCCTATC TCAGTCTGTA CAATATTTCG 
GTGGATATGG TTATCTCCAA CAGAATTATC CCGCCGGAAG TTACCGATCC TTATTTCGTT 
TACTGGAAAG AGCATCAGCA GCGTTACAGA CAGGAAATCA TCGATAATTT CAGTCCTCTG 
CCGGTCAAGG AGGTTCCTCT CTATACACGT GAAATCTGCG GCTTGAAAAC ACTCGAAAAA 
CTTAAGGATT TTCTCTATCG TGATGAGGAC CCTTCAAAGG TTTATTATTT TCGTAATACG 
TTTACTATCA GAAAGGTTGA AAACGGTTTT TCTCTCGAAC TTTATCTTCC GGGTATTCCC 
AAAGATCAAA TTCAGCTCAG CAAAAGCGGC GATGAACTGA ATATCCATAT TGGCAATCAC 
CGGAGAAATA TGGTGCTCCC ACAATCTCTT GCAACGCTGA ATACGGCCGG CGCAGAAATG 
AACAGCGATC ATCTGGTGAT CAGGTTTTCA GAAATGGATG CAAAATAG

Protein sequence

MRLILMTGKG GVGKTSMAAA TGLRCAELGY KTLVLSTDPA HSLADSFDIP LGHEAVKICD 
NLYGAELDVL QELEQNWGTV KRYITQVLQA RGLDAVQAEE LAILPGMDEI FGLVRVFRHH 
REGNYDVLII DSAPTGTALR LLSIPEVSGW YMRRLYKPME KFALYLRPLV EPLFRPIAGF 
SLPDRALMNV PYEFYEQIDA LGKILTDNAI TSVRLVTNPE KMVIKESLRA HAYLSLYNIS 
VDMVISNRII PPEVTDPYFV YWKEHQQRYR QEIIDNFSPL PVKEVPLYTR EICGLKTLEK 
LKDFLYRDED PSKVYYFRNT FTIRKVENGF SLELYLPGIP KDQIQLSKSG DELNIHIGNH 
RRNMVLPQSL ATLNTAGAEM NSDHLVIRFS EMDAK