Gene Arth_3355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3355
Symbol
ID	4444084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3770298
End bp	3773033
Gene Length	2736 bp
Protein Length	911 aa
Translation table	11
GC content	65%
IMG OID	639691178
Product	DNA topoisomerase I
Protein accession	YP_832830
Protein GI	116671897
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA
TIGRFAM ID	[TIGR01051] DNA topoisomerase I, bacterial

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCAAGCA AGGCCAAAAC CGGCAAGAAA CTCGTGATTG TGGAGTCTCC GGCCAAGAGC 
AAGACCATCG CCAAGTACCT GGGCGAGGGC TTCATCGTTG AGGCCTCCAT CGGTCACATT 
CGTGATCTGC CGCAGCCGTC CGAGCTCCCC GCCGAACTCA AGAAAACCTC CATCGGTAAG 
TTCGCGGTCG ACATCGAACA CGACTTCAAG CCGTACTACG TGGTGTCCCC GGATAAGAAG 
AAAAAGGTGA CTGAGCTCAA GGCTGCGCTC AAGGACGCTG ACGCCCTCTA CCTCGCAACC 
GATGGGGACC GCGAGGGAGA AGCCATCGCG TGGCACCTGC TGGAAGTACT CAAGCCCAAG 
GTCCCCGTCT ACCGGATGAC CTTCGGCGAA ATCACCAAGG AAGCCATCCA GCGCGCCATG 
GGCAACTTGC GCGATGTCGA CCAGGACCTC GTGGACGCCC AGGAAACCCG ACGCGTACTT 
GACCGCCTGT ACGGCTACGA AATTTCCCCG GTGCTGTGGC GCAAGGTCGC CCGCGGCCTG 
TCCGCCGGCC GTGTCCAGTC CGTGGTCACC CGCATGGTGG TGGACCGCGA ACGGGAACGC 
ATGGCGTTCA AGGCCGCGTC CTACTGGGAC CTCACCGGCC AGTTCGGTGC CGGCAACGGC 
GCGACGTCGT CATTCAAGGC GAAGCTCGCT GCCGTCGACG GCGCCAAGGT GGCCAGCGGC 
CGGGACTTCA ACGACGACGG CGAACTCACC TCGCGCAACG TCACACACCT GAATGAGGAA 
CTTGCCACGT CGCTGGCAGC GGGACTGCAG AACGCGGAAT TCCGTGTCCG CTCCGTCGAC 
ACCAAGCCGT ACACCCGCCG CCCGGCCGCT CCCTTCACCA CGTCTACGCT GCAGCAGGAG 
GCGGGCCGCA AGCTGCGGTT CTCCTCCAAG AGCACCATGC AGGTGGCCCA GCGCCTCTAC 
GAAAACGGCT ACATCACCTA TATGCGTACG GACTCGTCCG CGCTGAGTGA TGAGGCCGTG 
ACGGCTGCGC GGCGCCAGGC CTCCGAGCTC TACGGGCCGG AGTACATACC GCAGTCGCCC 
CGTGTTTACA CCGGCAAGGC AGCCAACGCA CAGGAAGCCC ACGAGGCCAT CCGCCCCGCC 
GGCGACTCCT TCCGCACCCC GGCGCAGGTG GCCAAGCAGC TCTCGGGTGA CGAATTCCGG 
CTCTACGAGC TCATCTGGAA GCGCACCGTT GCCTCCCAGA TGGGCGACGC CAAGGGCTCC 
ACGGCCACCA TCCGCCTCGG CGCGGTGGCT GCGGACGGCC GCGACGCCGA GTTCTCCGCT 
TCCGGCACCG TCATCACCTT CCCCGGATTC CTCGCCGCCT ATGAGGAAGG CAAGGACGAA 
AGCCGCGGGG ACGATGACTC CGAGGAAGCC CGCCGCCTCC CCAACGTGGC CAAGGATGAC 
GCCCTTACGG CCTCGGAGAT CGTCGCCGTC GGCCATGAGA CCTCGCCGCC GCCGCGCTAC 
ACGGAAGCTT CCCTGACAGC CGAGCTGGAA AAGAAGGGCA TCGGACGCCC GTCCACCTAT 
GCGTCCACCA TTTCCACCAT CCAGGACCGC GGCTACGTGC GTAAGCAGGG TTCCGCGCTG 
GTCCCGAGCT GGATAGCCTT CTCGGTGATC CGCTTGCTCG AGCAGCACTT CCATGACTAC 
GTGGACTACG AGTTCACCGC AGACATGGAA GGCGACCTGG ACAAGATCGC CAACGGCCAG 
GCCGTGGGCG CCGCCTGGCT CAAGCATTTC TATTACGGCG AAGACTCCGA TCCCGGCCTG 
CTGAGCATCG TGAACAACCT TGGCGAAATC GACGCCAGGG AAATCAACTC CGTACCGATC 
GCCGAAGGCA TCACCCTGCG CGTGGGTAAG TTCGGCCCGT ACCTGGAGAG CTCCGTTCCC 
ACGATCGATC CCAAGACCGG CGAAGTGGTG GAGTCGGCCC GCGCCAACGT CCCTGAGGAC 
CTGGCCCCGG ACGAGCTGAC GGCCGCCAAG GCGAAAGAGC TGATGGAGAC AGCAGCGCCG 
GAGGAGAGGG TCCTCGGCGA AGACCCGCAC ACGGGCCACA CGATCGTGGC CAAGAACGGG 
CGCTACGGTG CCTACGTCAC GGAAATCATT CCGGAGATGA CGGATGAGCA GCTGGCCAAC 
CAGCCCGTCG AGTACTACAA GAACGGCAAG CCCAAGCCGC CGAAGAAGCC TGTGAAGGCC 
AAGCCGCGCA CGGGTTCGCT GTTCGCCTCC ATGAGCGTGG ACAGCGTCAG CCTGGACGAG 
GCCCTGCAGC TCATGAGCCT GCCGCGCGCT CTCGGCCAGG ACGCCGAAGG CAACGTCATT 
ACCGTGCAGA ACGGCCGCTT CGGCCCCTAC CTGAAAAAGG GCACCGACTC GCGTTCCATC 
GGTTCCGAAG AGGAAATCTT CACGATCACG CTGGAGCAGG CGCTGGAGAT CTACTCCCAG 
CCCAAGCAGC GTGGAGCGCG TGCGGCGGTC CCGCCGCTCG CCGAGTTCGG TCCGGACCCG 
GTGTCGGAGA AGAACATCGT GGTGAAGGAA GGCCGCTTCG GCCCCTACAT CACCGACGGG 
ATCACCAACA TCACTGTTCC GCGGTCCACC TCGCTGGAGG AACTGACCCG CGAACAGGCC 
GTGGAACTGC TCGCGGAAAA GCGTGCCAAG GGCCCGGCCA AGCGTCCCGC GGCGCGCAAG 
GCCCCGGCGA AGAAGAAGGC TGTCGCCAAG AAGTAG

Protein sequence

MPSKAKTGKK LVIVESPAKS KTIAKYLGEG FIVEASIGHI RDLPQPSELP AELKKTSIGK 
FAVDIEHDFK PYYVVSPDKK KKVTELKAAL KDADALYLAT DGDREGEAIA WHLLEVLKPK 
VPVYRMTFGE ITKEAIQRAM GNLRDVDQDL VDAQETRRVL DRLYGYEISP VLWRKVARGL 
SAGRVQSVVT RMVVDRERER MAFKAASYWD LTGQFGAGNG ATSSFKAKLA AVDGAKVASG 
RDFNDDGELT SRNVTHLNEE LATSLAAGLQ NAEFRVRSVD TKPYTRRPAA PFTTSTLQQE 
AGRKLRFSSK STMQVAQRLY ENGYITYMRT DSSALSDEAV TAARRQASEL YGPEYIPQSP 
RVYTGKAANA QEAHEAIRPA GDSFRTPAQV AKQLSGDEFR LYELIWKRTV ASQMGDAKGS 
TATIRLGAVA ADGRDAEFSA SGTVITFPGF LAAYEEGKDE SRGDDDSEEA RRLPNVAKDD 
ALTASEIVAV GHETSPPPRY TEASLTAELE KKGIGRPSTY ASTISTIQDR GYVRKQGSAL 
VPSWIAFSVI RLLEQHFHDY VDYEFTADME GDLDKIANGQ AVGAAWLKHF YYGEDSDPGL 
LSIVNNLGEI DAREINSVPI AEGITLRVGK FGPYLESSVP TIDPKTGEVV ESARANVPED 
LAPDELTAAK AKELMETAAP EERVLGEDPH TGHTIVAKNG RYGAYVTEII PEMTDEQLAN 
QPVEYYKNGK PKPPKKPVKA KPRTGSLFAS MSVDSVSLDE ALQLMSLPRA LGQDAEGNVI 
TVQNGRFGPY LKKGTDSRSI GSEEEIFTIT LEQALEIYSQ PKQRGARAAV PPLAEFGPDP 
VSEKNIVVKE GRFGPYITDG ITNITVPRST SLEELTREQA VELLAEKRAK GPAKRPAARK 
APAKKKAVAK K