Gene Cpha266_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0109
Symbol
ID	4569463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	126637
End bp	129036
Gene Length	2400 bp
Protein Length	799 aa
Translation table	11
GC content	52%
IMG OID	639764711
Product	DNA topoisomerase I
Protein accession	YP_910603
Protein GI	119355959
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA [COG0551] Zn-finger domain associated with topoisomerase type I
TIGRFAM ID	[TIGR01051] DNA topoisomerase I, bacterial [TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTAA AATCCCCGGC AGCCTCGGCA AGAAACAGGA CTCTTATTGT TGTCGAGTCT 
CCATCAAAGG CAAAAACAAT CAACAAATAC CTTGGGGACA AATATACCGT TTTCGCTTCG 
GTCGGGCACA TCAAGGATCT TCCGAAAAAA GAGATCGGAC TTGATTTCGA TCACCACTAT 
GAACCACGAT ACGAAGTCAT TGCAGGAAAA GAAAAAGTTG TCCGGCAGCT CAAAAAGCTT 
GCCGATGAAT CCAACGAGAT CCTGATCGCA ACTGACCCTG ACCGCGAAGG CGAAGCGATT 
GCCTGGCATA TTGCCAACGA AGTGGAATTT GCCCATAAAC CGGTATTCCG GGTGCTGTTC 
AATGAAATCA CCAAAACAGC CATTATCGCC GCTATCCAGC AACCTCGCCA AATCGACTAC 
CGCCTTGTCC GCTCCCAGCA GACGCGACAG GGTCTCGATA AAATCGTAGG ATACAAGATC 
AGCCCCTTTC TATGGAATGT TGTCTTGCGC GGACTCTCCG CAGGAAGAGT TCAGTCTGTC 
GCATTACGGT TGATCTGTGA ACGCGAAGCC GAAATCAATG GATTTCAGAT CCAGGAGTAC 
TGGAGCATTG CCGCTGACTT TAAAACCGAT CTCAACGAAA CCTTCCGGAC AAAGCTCATT 
AAAATAAAGG GCGACAAACC CGAGCTTTCC AATCAGAAAA AAGCCGAAAC CGCTGCGGCA 
GAAATCAGTG AACGCCTGTT TGCCGTAAAG GAGATAACGA CAAGGGTGCA ACAGCGAAAG 
CCCCCGTTTC CCTTTACCAC CTCGCTTCTT CAGCAGGCGG CCTCAAACCA GCTCGGGTTC 
GGATCGCAGA AGACCATGCG GATTGCCCAG CAGCTCTATG AAGGGATCGA GCTTGGCGAC 
GAAGGCGCAA CCGGTCTGAT CACCTATATG AGAACCGACT CAATCAGAAT AGGAACAGAA 
GCGACCGCCG AGGCAAGAAA CTATATCACC GCTCAATTCG GCAAGGAGTA CGTCGGATAC 
GGAGGCGCTG CAAAAGCGGG CAAAAACGCG CAGGACGCCC ATGAGGCAAT CCGTCCCACC 
TCGCTGTTAC GAAAACCGGA ATCGGTCAAA CACTTCCTTT CAAGCGATCA GTTCCGACTG 
TACGAACTGA TCTGGAGGCG GCTCCTTACC GCCATGATGG CTCCCGCAAA AATAGAACAG 
ACAAGAGTCG ATGTCGAAGA TCGTGAAAAA GAGTTCACCT TCAGAGCCAA TGGCAGCAGG 
GTGCTTTTTG CCGGATTCAT GCGGGTTTAT GACGATCAGC AGGAACTGGA TTATGAAGCT 
CAGTCCTCAA CGCGCGACGA TGTTGAAAAA GAACAGACTG TTCAGCTCCC CGAGAAACTG 
AAGGAACAGG ACAAGCTTGG TCTCGCAGGC CTTGACAGCA AGCAGAGCTT CACCCGACCT 
CCCGCCCGAT ACAGCGAAGC AACGCTCGTC AAGGATCTGG ACAACTACGG GATCGGACGC 
CCGTCAACCT ATGCATCGAT TTTTTCAACC CTGCAGGATC GACGCTATGT TGAGCTGCAA 
AAGAAAAAAA TCATACCGAC AGAGCTTGGC AAGGATGTCT CGCTTATTCT TGTGGCAAAT 
TTTCCCGAAC TGTTCAATGT CGGCTTCACG GCACATATGG AGGACGAGCT TGACAAAGTT 
GCTTCCGGAG ACGATGAGTA CGAAGCTGTG CTCGAAAAAT TCTATCGACC GCTTGAAACG 
GCATTGAGTC TGAGAAAAAG CGACCCGATC ATTCCCCAGA ACAGTGCGAC CGAGACCTGC 
GACAAATGCG GAAAGGGACA AATGACCGTA AAATGGACGG CAAGCGGAAA ATTTCTCGGC 
TGTTCGCGCT ACCCTTCATG CAAAAACATC AAGCCGCTGA GCTCATCGAA AGCAAAACCG 
AAAGATACCG GAATACAGTG TCCCTCCTGT AAAGAGGGAC ATATGCTGCT CCGAGACGGA 
AGACTCGGCC CTTTTCTTGC CTGCTCCAGC TATCCGAAAT GCAATACGCT GCTCAATCTC 
GGCAAACAGC GCCAGGTCGA ACCGATGAAA ATTCCTCCGC TCCTCACCAC CCTTGTCTGC 
CCGAAATGCG GAGCTCCAAT GAACCTCAGA AGCGGAAAAA GAGGACTATG GCTCGGATGC 
TCCAAGTTCC CGAAATGCCG CGGACGACTT GCCTGGGGAA CCCTGGATGA GGAGGTTCAG 
CGCCACTGGG AAACCCTGAT GACAGAGCAT CAAAAAGCCC ATCCGACAGT TGCGCTGACC 
ATGATAGACG GGCGTCCGGT ACCGCTCACC CTTTCGGTTG ACGATATCAT CACCCGAGCC 
GAAGAGGCCG GACTTATTGC CGCCGTACCG GAAGAGCAGC AGGAGCTCAC AGCAGAATAA

Protein sequence

MALKSPAASA RNRTLIVVES PSKAKTINKY LGDKYTVFAS VGHIKDLPKK EIGLDFDHHY 
EPRYEVIAGK EKVVRQLKKL ADESNEILIA TDPDREGEAI AWHIANEVEF AHKPVFRVLF 
NEITKTAIIA AIQQPRQIDY RLVRSQQTRQ GLDKIVGYKI SPFLWNVVLR GLSAGRVQSV 
ALRLICEREA EINGFQIQEY WSIAADFKTD LNETFRTKLI KIKGDKPELS NQKKAETAAA 
EISERLFAVK EITTRVQQRK PPFPFTTSLL QQAASNQLGF GSQKTMRIAQ QLYEGIELGD 
EGATGLITYM RTDSIRIGTE ATAEARNYIT AQFGKEYVGY GGAAKAGKNA QDAHEAIRPT 
SLLRKPESVK HFLSSDQFRL YELIWRRLLT AMMAPAKIEQ TRVDVEDREK EFTFRANGSR 
VLFAGFMRVY DDQQELDYEA QSSTRDDVEK EQTVQLPEKL KEQDKLGLAG LDSKQSFTRP 
PARYSEATLV KDLDNYGIGR PSTYASIFST LQDRRYVELQ KKKIIPTELG KDVSLILVAN 
FPELFNVGFT AHMEDELDKV ASGDDEYEAV LEKFYRPLET ALSLRKSDPI IPQNSATETC 
DKCGKGQMTV KWTASGKFLG CSRYPSCKNI KPLSSSKAKP KDTGIQCPSC KEGHMLLRDG 
RLGPFLACSS YPKCNTLLNL GKQRQVEPMK IPPLLTTLVC PKCGAPMNLR SGKRGLWLGC 
SKFPKCRGRL AWGTLDEEVQ RHWETLMTEH QKAHPTVALT MIDGRPVPLT LSVDDIITRA 
EEAGLIAAVP EEQQELTAE