Gene Cagg_1347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1347
Symbol
ID	7268639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1667890
End bp	1670232
Gene Length	2343 bp
Protein Length	780 aa
Translation table	11
GC content	57%
IMG OID	643566190
Product	DNA topoisomerase I
Protein accession	YP_002462690
Protein GI	219848257
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA [COG0551] Zn-finger domain associated with topoisomerase type I
TIGRFAM ID	[TIGR01051] DNA topoisomerase I, bacterial

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000873362
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000469192
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGGTGAAA AAGTTGTGAT TGTTGAGTCG CCGGCCAAAG CGCGGACGAT TCAGAAATAT 
CTGGGTAAAG GCTATAAAGT GACCTCAAGT ATGGGTCACG TGCGCGATTT GCCGAAAAAT 
GGGCTGGCGA TCGATATCGA GCACGATTTT GCTCCTTCTT ATGAAATTGT GAAGCCCAAG 
GTAGTGAGTG AGCTGAACCA GGCTGTGCGC AATGCTGACG CGATCTATTT GGCAACTGAC 
CCCGACCGTG AGGGCGAGGC GATTGCGTGG CATATTACCC AAGCGGTGAA GACGCCGAAA 
AAGACGCCGA TCTATCGCGT CGTTTTTCAA GAGATTACGC GCAATGCCGT TCAGCAGGCG 
TTGCAGCAGC CACGTCAGAT CAACCAAAAT CTGGTTGACG CGCAACAAGC ACGGCGCGTG 
CTCGACCGTT TGGTCGGTTA CCAGCTTAGT CCATTGTTGT GGGATAAGGT CAAGCGCGGG 
CTGAGCGCCG GACGGGTGCA ATCGGTGGCG GTGCGGCTGA TCGTCGAGCG TGAGCGTGAA 
ATTGAGAACT TTAAGCCGCA AGAGTATTGG ACAATCGAGG CTGATCTGCT GAAAGAGGCC 
GGTATCGCGC CGCGTGATCT GTTTCGGGCG ACGCTCATCG AGCGCGACGG TAAGAAGCTT 
GAGAAATTCT CGATTGAACG CCGTGAGCAA GCTGAGGCGA TTGTCGCCGA TCTACAAGGT 
GCGGCGTATA CCGTCCTTAA AGTGACCCGT CGCGATAAGC GGCGATCACC ACCACCACCG 
TTTACCACCA GCACCTTACA ACAAGAGGCT GCCCGTAAGT TGGGTTTCAG CGCGAAGAAG 
ACGATGATGC TGGCTCAGCG TCTCTACGAA GGTGTTGATA TTGGTGGTGA GGAGGGGATG 
GTCGGTCTCA TCACCTATAT GCGTACCGAT AGTGTGCAGG TGGCGGCAGA AGCCCAAGCT 
GAGGCGCGTG AGGTGATCGA TCGGCGGTTT GGGCGTGAGT ATCTGCCCGA CCAGCCGCCG 
GTCTACAAGA TCAAGGCGAA AGGCGCGCAA GAGGCTCACG AGGCAATCCG GCCTACCAGC 
AGTGCCCGTA CTCCTGAGCA GTTGAGCGAA CGGCTGGAGC GCGATCTGTG GCGGCTCTAC 
GATCTGATTT GGAAGCGATT TATCGCTTCG CAGATGGCTC CGGCCATTTT CGACAGCACC 
ACCGTTGATA TTGCTGCCCA ACCGAGTGTG GCCGGTGCGC CACCCTACTT GTTCCGTGCT 
ACCGGCTCGG TGCTCAAGTT CCCCGGCTTC CTTGCCGTTT ACAACGTGAG CCTTGATGAG 
GGCGAGGAAG ATGAAGACAG TGAGCGTCGC TTGCCGCCAC TGGTCGAGGG CGAAAACCTC 
CAGTTAGTTG AGCTGTTGCC GGTGCAGCAC TTCACCGAAC CGCCGCCGCG CTACACCGAG 
GCCAGTCTGG TGAAAGAACT CGAACGTCTT GGGATTGGGC GTCCGAGTAC CTACGCAACG 
ATTCTTTCGA CCATCCAGGA ACGCGAGTAC GTCGAGATGG TCGATAAGAA ACTGATTCCG 
ACGATGCTTG GCCGGATTGT GACCGACTTG TTGGTTGAGC ATTTCGGCAA CATCGTCGAT 
TACGACTTTA CGTCGTCGCT TGAACAGCAG CTTGACGATA TTGCCGAAGG CTCGAAGCAG 
TGGGTGCCGG TGCTGCGCGA ATTCTATGGC CCCTTCCGCT CGACGCTGGA AACAGCTCAA 
CGCCAGATGC GCAATGTCAA GCGCGAAGAG ATTATCACCG ATCTCGATTG CCCGAAGTGC 
GGCAAAGGGA AGCTGGTGAT CAAGTTTGGC CGCAACGGCG AGTTTCTGGC CTGTTCGCGC 
TACAACCGGG AAGGCGAGGG TGATTCGTGC GATTTCACCG GCGATTTTCA CCGCGATGAA 
AATGGCAATA TTGTGCTCGA TCAGGCCAGC GCGCCAGAGA CGAGCGATGT CTTGTGTAAT 
GTCTGTGGGC GGCCAATGGT GATCAAGAAG AGCCGTTTCG GCCCCTTCCT CGGCTGTTCG 
GGATACCCTG AATGCACCAA CACCCGCCGG ATTGGCCGCG ACGGCAAGCC GGTTCCACTC 
CCCGAACCAA CCGGCGTTAC CTGCCCGAAG TGCGGTGAAG GGGAGTTACT ACGTCGACGC 
GGCAAGTTTG GCCGTCCGTT CTACGGCTGC TCGCGCTACC CCAAGTGCGA CTACATCACC 
AACTCGCTTG ACGAAGCGCA GGCAGGAGTG GCGGTCGAAG CTGCGCCAGC GCTGCCTCCT 
ACCGTTGAGA AACCGGCGGC ACCAGCCCGC AAATCTAGTG GCAAGACCCG CAAATCGGCG 
TAA

Protein sequence

MGEKVVIVES PAKARTIQKY LGKGYKVTSS MGHVRDLPKN GLAIDIEHDF APSYEIVKPK 
VVSELNQAVR NADAIYLATD PDREGEAIAW HITQAVKTPK KTPIYRVVFQ EITRNAVQQA 
LQQPRQINQN LVDAQQARRV LDRLVGYQLS PLLWDKVKRG LSAGRVQSVA VRLIVERERE 
IENFKPQEYW TIEADLLKEA GIAPRDLFRA TLIERDGKKL EKFSIERREQ AEAIVADLQG 
AAYTVLKVTR RDKRRSPPPP FTTSTLQQEA ARKLGFSAKK TMMLAQRLYE GVDIGGEEGM 
VGLITYMRTD SVQVAAEAQA EAREVIDRRF GREYLPDQPP VYKIKAKGAQ EAHEAIRPTS 
SARTPEQLSE RLERDLWRLY DLIWKRFIAS QMAPAIFDST TVDIAAQPSV AGAPPYLFRA 
TGSVLKFPGF LAVYNVSLDE GEEDEDSERR LPPLVEGENL QLVELLPVQH FTEPPPRYTE 
ASLVKELERL GIGRPSTYAT ILSTIQEREY VEMVDKKLIP TMLGRIVTDL LVEHFGNIVD 
YDFTSSLEQQ LDDIAEGSKQ WVPVLREFYG PFRSTLETAQ RQMRNVKREE IITDLDCPKC 
GKGKLVIKFG RNGEFLACSR YNREGEGDSC DFTGDFHRDE NGNIVLDQAS APETSDVLCN 
VCGRPMVIKK SRFGPFLGCS GYPECTNTRR IGRDGKPVPL PEPTGVTCPK CGEGELLRRR 
GKFGRPFYGC SRYPKCDYIT NSLDEAQAGV AVEAAPALPP TVEKPAAPAR KSSGKTRKSA