Gene Cagg_1223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1223
Symbol
ID	7266209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1500194
End bp	1501393
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	57%
IMG OID	643566066
Product	arsenite-activated ATPase ArsA
Protein accession	YP_002462568
Protein GI	219848135
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.293801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACTC TGATCTTTAC CGGAAAAGGC GGCGTTGGTA AGACGAGCGT CGCCGCAGCA 
ACGGCCCTAC GGGCTGCCGA TCGTGGCTTA AAAACACTGG TCATGAGCAC CGATCCTGCC 
CACTCACTGG CCGATTCGCT CGATCTCGAG GGACCGCTGG GTCCTGAACC CGTTCGGATT 
ACGAAGAACC TTGATGCGCT CGAAGTCAGC ATCTATCACG ACATCGAAAG CAACTGGGGT 
ATTGTGCGCG AGCACTTCGC CCAACTTATG GCCGAGCAGG GCGTACAGGG CGTTTTGGCC 
GATGAGATGA GCGTCCTGCC CGGTATGGAA GAGGCCTTCC CGCTTATTCG GATCAAGAAG 
CATAAGGAGC GCGGTGATTA CGATCTTTTG GTGATCGATT GCGCGCCCAC CGGCGAGACG 
CTACGGCTCC TTTCGGCCCC TGAAACGTTC AAGTGGGCGA TCAATATGTT GCGTGGGGCC 
GAGCGTTACG TCATCCGGCC ACTGATCCGC CCAATGAGCA AGATCACGCC CGGCCTCAAC 
AAAATGGTCG CGCCGCCTGA AGTGTACGAT GCCGTTGATG AGATGTTCCG CCAGATGGAG 
GGGGTAACCG CGACGCTGGC TAATCCGCGC GAAACTTCGA TCCGCCTGGT GATGAACCCT 
GAAAAGATGG TGATCAAGGA GAGCCAGCGG GCGTTGACCT ACCTGTCAAT GTACGGGATG 
ACCGTTGACA TGGTCGTGGT CAATAAGATT TTACCTCTTG ACCAAGATAG CGGTTATCTG 
AACCATTGGC GTGATGTGCA GCAGCGGTAT CTGCAAGACG TGGAGCACTC ATTTGTGCCG 
TTGCCGATTC GGCGTGTGCC CTACTATCCC GAAGAGGTTG TCGGCCTTGA GAAGCTGCGC 
CGGATGGGGG ATGATATCTA CGGCGATATG GATCCAACGG CCGTGCTCTA CGACCGCGCA 
CCGCTAGAGA TTACTAAGGC TGGCGATAAA TTCTACCGGG TGAAGATCCG CTTGCCGTTT 
GCCGATGTTT CACAACTCGA TCTCTACCAG AACGGTGATG AGTTGGTTGT CCAGATCGGC 
GATTTCCGCC GTGTTATTAC CCTGCCGACG AGCCTTGCCG GCCTTGAAGC CGGGCAGGCA 
GAGATGGAGG GTGAGTGGTT GATCGTGCCC TTCATGGCGC CGCAACTGGC GTCACGCTGA

Protein sequence

MRTLIFTGKG GVGKTSVAAA TALRAADRGL KTLVMSTDPA HSLADSLDLE GPLGPEPVRI 
TKNLDALEVS IYHDIESNWG IVREHFAQLM AEQGVQGVLA DEMSVLPGME EAFPLIRIKK 
HKERGDYDLL VIDCAPTGET LRLLSAPETF KWAINMLRGA ERYVIRPLIR PMSKITPGLN 
KMVAPPEVYD AVDEMFRQME GVTATLANPR ETSIRLVMNP EKMVIKESQR ALTYLSMYGM 
TVDMVVVNKI LPLDQDSGYL NHWRDVQQRY LQDVEHSFVP LPIRRVPYYP EEVVGLEKLR 
RMGDDIYGDM DPTAVLYDRA PLEITKAGDK FYRVKIRLPF ADVSQLDLYQ NGDELVVQIG 
DFRRVITLPT SLAGLEAGQA EMEGEWLIVP FMAPQLASR