Gene Apre_1289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1289
Symbol
ID	8398079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1386195
End bp	1388249
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	42%
IMG OID	644995634
Product	DNA topoisomerase I
Protein accession	YP_003153033
Protein GI	257066777
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA
TIGRFAM ID	[TIGR01051] DNA topoisomerase I, bacterial

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.781177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCTAAGA ACCTAGTAAT AGTAGAGTCT CCAACCAAGG CCAGATCCAT CTCAAAGATG 
CTCGGAAGAA ACTACAAGGT AATGGCAACA GTAGGCCACC TCCGTGATCT TCCAAAGAGC 
AAGTTTGGAG TGGATATAGA AAATAACTTT GAACCAGAAT ATATCAAGGT TAGGGGACGA 
GCAAAGACTA TAAATGAACT AAAAAAAGAA GCGAAAAAGG CAGAAAATGT CTACCTTGCG 
ACAGACCCGG ATAGGGAAGG AGAGGCCATA AGCTGGCATT TACAATTTCT CTTAGACCTT 
GACCCTGAAG CGAAAAACAG GGTAGAGTTC CACGAGATAA CCAAAGAAAA TGTCAAGAAC 
GCCATCAAAA ACCCAAGGAA AATCGACCAG AACCTAGTTG ACGCTCAACA GGCAAGGCGA 
GTAATGGATA GGATTGTAGG TTACGAGATA AGCCCAATCC TCTGGAAGAG GGTCAAGGCA 
GGTTTATCTG CAGGTCGTGT CCAATCAGTT GCCCTAAAGC TTATAGTAGA TAAGCAAAAG 
GAAATCGACG ATTTTGTTCC AGAAGAATAC TGGACTATAA CAGCCCACCA CAAGGAAGGT 
AGGGAGAAAT TCGACTCAGA ATTCTATGGA CAAATCAACA AGAAAATAAA AATAAGCAAT 
GAAAACGGAG CGGATAAGGT CCTAAATAAA ATCGATAAGG ATAAGTTTGA AGTTGTAAAA 
ATCACCAAGA CTAAAAAGAG AAGAAAGCCT CAAAAGCCTT ACACAACCTC AACCCTCCAA 
CAAGATGCCT CCAATAGATT AGGGTTTTCT ACAAGATTTA CCATGCAGCT AGCCCAACAG 
CTCTTTGAGG GTATAGATGT AGGAGATGGA AGTGTGGGTC TTATTACCTA TATGAGAACT 
GACGCTAACA GGATCTCTAA GGAGATCGTA GGCGAAGCCC TCTCATATAT TAAGGAAAAA 
TACGGACCGG AATATGCTGG CAAGGGAAAT ACCTACGGGG GCAAGAAAAA GGGCAGCCAA 
GATGCCCACG AGGCCATAAG ACCTACCTCT ATTAGGAGAA ATCCTCTAGA GATTAAGGAA 
TACCTAACAG ATCAACAATA TAAGCTATAC AAGATGATTT GGGAAAGAGT CGTAGCAAGC 
CAGATGACAG ATTACGAATT CCTATCAACC CAAGTCCTAT TCGACAACAA TTCCCTAATC 
TTTAAGACAA ACGGGAAAAT CACCCTATTT GAAGGTTTCA ATAAATTGGG AGCAAATAAA 
GAAAACGAAA ATATCCTACC AGAGCTTAAG GAAGGGGATG TGATAAGTGC TGAGTCAATC 
GATAAGGACC AACACTTCAC TAAGCCTCCA GCAAGATATA CTGAGGCAAG TCTTGTAAAG 
ACCCTAGAAG AATTCGGCAT AGGTAGACCT TCAACCTATT CTGCTACCAT CAACCAAATC 
ATCTCAAGAA ACTACGTAGA ACTTGAAGGA AGATCAATCT TCCCAACAGA TCTAGGAAAA 
ACCGTAAATA CCTTCCTCCA AGAAAACTTT GACGATGTAA TAAACGTAGA GTTCACCAGG 
GAAATGGAAG ATGCCTTGGA TAATATCGCA GAAGGAGATA GATTCTGGAA AGAAACATTA 
AAATCCTTCT ACAAGGACTT CGAAAAAGAC ATGAAGGGTG TCAAAAAGGA CGGCAAGGAC 
TACAAGGTAA GAGATGAAAT CTTAGAAGAA AAATGCCCAA AATGCGGAAA GCCTCTTGCC 
ATCAAACACG GAAGAAACGG GAAATTCATA GGCTGTACCG GCTTTCCAGA TTGTAACTTT 
ACCAAATCAA TAGTAAAATC AACCGGAGTC AAATGCCCAG AATGTGAAGA CGGAACGATA 
ATAGAAAAAG TCAGCAAAAG AGGCAAGAGA TTCTACGGCT GTGACAACTA CCCAAAATGC 
GACTTTGCCC TATGGGACCC ACCAACAGGA GAAAAATGTC CAGAATGCGG CTCTCTCCTA 
ATCCACAAGA AAAACAGGTC CACAGACGAA ATAAAATGCT CCTCCTGTGA CTATGTCAAA 
GAAAAGAGGA GATAA

Protein sequence

MAKNLVIVES PTKARSISKM LGRNYKVMAT VGHLRDLPKS KFGVDIENNF EPEYIKVRGR 
AKTINELKKE AKKAENVYLA TDPDREGEAI SWHLQFLLDL DPEAKNRVEF HEITKENVKN 
AIKNPRKIDQ NLVDAQQARR VMDRIVGYEI SPILWKRVKA GLSAGRVQSV ALKLIVDKQK 
EIDDFVPEEY WTITAHHKEG REKFDSEFYG QINKKIKISN ENGADKVLNK IDKDKFEVVK 
ITKTKKRRKP QKPYTTSTLQ QDASNRLGFS TRFTMQLAQQ LFEGIDVGDG SVGLITYMRT 
DANRISKEIV GEALSYIKEK YGPEYAGKGN TYGGKKKGSQ DAHEAIRPTS IRRNPLEIKE 
YLTDQQYKLY KMIWERVVAS QMTDYEFLST QVLFDNNSLI FKTNGKITLF EGFNKLGANK 
ENENILPELK EGDVISAESI DKDQHFTKPP ARYTEASLVK TLEEFGIGRP STYSATINQI 
ISRNYVELEG RSIFPTDLGK TVNTFLQENF DDVINVEFTR EMEDALDNIA EGDRFWKETL 
KSFYKDFEKD MKGVKKDGKD YKVRDEILEE KCPKCGKPLA IKHGRNGKFI GCTGFPDCNF 
TKSIVKSTGV KCPECEDGTI IEKVSKRGKR FYGCDNYPKC DFALWDPPTG EKCPECGSLL 
IHKKNRSTDE IKCSSCDYVK EKRR