Gene Caul_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1744
Symbol
ID	5899199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1831687
End bp	1833966
Gene Length	2280 bp
Protein Length	759 aa
Translation table	11
GC content	68%
IMG OID	641562234
Product	DNA topoisomerase IV subunit A
Protein accession	YP_001683371
Protein GI	167645708
COG category	[L] Replication, recombination and repair
COG ID	[COG0188] Type IIA topoisomerase (DNA gyrase/topo II, topoisomerase IV), A subunit
TIGRFAM ID	[TIGR01062] DNA topoisomerase IV, A subunit, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.629764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAC CAGTCCTTCC CCCTGGCGGC CCCGGCGACG GCGATCGCAT TCTCGACGAA 
CCGCTCAGCG AAGCGCTTTC GAAGCGCTAC CTGGCCTATG CGCTGTCGAC GATCGGCTCG 
CGGGCCTTGC CCGACGTGCG CGATGGCCTG AAGCCCGTGC ACCGCCGCGT GCTGCACGCG 
ATGAACAACA TGCGCCTCAA CCCCGAGGGC GGCGCGCGCA AGTGCGCCAA GGTGGTCGGC 
GAGGTGATGG GTAACTTCCA CCCGCACGGC GACCAGTCGA TCTATGACGC CCTGGTCCGC 
CTGGCCCAGG AGTTCTCGCA GCGCGTGCCA TTGGTCGATG GCCAGGGCAA CTTCGGCAAT 
ATCGACGGCG ATAGCGCCGC GGCCATGCGC TACACCGAGT GCAAGATGAC CGCCGCGGCC 
GTGCTGCTGC TGGACGGCAT CGACGAGGAC GCGGTCGACT TCAAGCCGTC CTATGACGGC 
CAGGACGAGG AGCCGGTGGT CCTGCCGTCG GGCTTCCCCA ACCTGCTGGC CAACGGCTCG 
TCGGGCATCG CGGTGGGCAT GGCCACCTCG ATCCCGCCAC ACAATCCCGC CGAGCTGATC 
GACGCCTGCC TGCTGCTGCT CAGCAAGCCC GAGGCGACGA CGGCCGAGAT CCTGGAACGC 
GTGCCGGGTC CGGACTTCCC GACCGGCGGC GTGATCGTCG AGTCCCGCGA GAGCCTGCTG 
GAGACCTACG AGACCGGCCG CGGCGGCGTG CGCACCCGCG CCAAGTGGGA GAAGGAAGAC 
ACCGGCCGCG GGACCTACCA GATCGTCGTC ACCGAGATCC CGTACCAGGT GAAGAAGTCC 
GACCTGGTCG AGCAACTGGC CGACCTGATC GACAGCAAGA AGGCCGCCCT GCTGGGCGAC 
GTCCGCGACG AGAGCGCCGA GGACATCCGC CTGGTGCTGG AGCCCAAGTC CAAGAACGTC 
GAGCCCGAAG TGCTGATGGA GAGCCTGTTC AAGCTCTCGG CGCTGGAAAG CCGCTTCCCG 
GTCAATATCA ACGTGCTGGA CGCGCGCGGC ACCCCCGGGG TGATGGGCAT CAAGCAGGCG 
CTGATCGCCT TCCTGGCCCA CCGCCGCGAC GTGCTGACCC GCCGGGCCCG CAACCGGCTG 
AGCAAGATCG AAGCCCGTCT GCACATCCTG GACGGCCTGC TGATCGCCTA CCTCAATCTC 
GACGAGGTGA TCCGCATCGT CCGCTACGAG GACGAGCCCA AGCAGAAGCT GATGGCCGCC 
TTCGCCCTCA GCGACATCCA GGCCGACGCC ATCCTCAACA CCCGCCTGCG CCAATTGGCC 
AAGCTGGAGG AGATGGAGAT CCGCCGCGAG CACGCGCAGC TGGTGGAAGA GCGCGACGGC 
ATCCTGGCGA TGCTGGCCAG CGACAAGAAG CAGTGGGACC TGGTCGGCAC GGGCCTGCGC 
CAGGTGCGCG CCGTGCTGCT GAAGATCAAG CACCCGCTGG ACAAGACGGG CCGCGCGACA 
GGGGTCATCG GCCGCTCGGT GTTCGAGGAC GCCCCGGTGG TCGACGCCGA GGCCGCGCTC 
GAGGCGCTGA TCGTGCGCGA GCCGATCACC GTCATCCTGT CGGACCGCGG CTGGATCCGC 
GCCGCCAAGG GCAAGGTCGA GGACCCCTCG GAGCTGAAGT TCAAGGAAGG CGACAAGCTG 
GGCTTCCTGG TCCCGGCCGA GACCACCGAC AAGCTCTTGC TGTTCACCAG CGACGGCCGG 
TTCTTCACGA TCGGCTGCGC CAACCTGCCG TCGGCCCGCG GTCACGGCGA GCCGGTGCGA 
ATGATGATCG AGCTGGACGA CAAGGTGAAG ATCATCGACG TCTTCCCGTT CAAGGCCGGG 
CGCAAGCGCT TCCTGGCCTC CAAACAGGGC TACGGCTTCC TGATGCCGGA AGAAGAGGCC 
CTGGCCAACC GCAAGGCCGG CAAGCAGGTC CTGACGGTCG ACGCGGCCGG CGCGGCCTTC 
TGCCTGGAGG CCGTCGGCGA CCAGCTCGCG GTGGTCGGCG ATAACGGCAA GATCCTGATC 
TTCCCGCTGG AGGAATTGCC GGAAATGCCG CGCGGCAAGG GCGTCAAGCT GCAGTCGTAT 
CGTGAAGGGG GATTGCGCGA CGCCATCTCC TTCAACGCCG ACGTCGGGGC GTTCTGGATC 
GACACCGCCG GCCGCCGGCG CGACTGGGTC GAGTGGCGCG ACTGGATCGG CAAGCGCGCA 
GGGGCCGGCA AGCTGTCGCC CAAGGGCTTC CCGACCTCAA AGCGGTTCCG GCCCAAGTGA

Protein sequence

MNKPVLPPGG PGDGDRILDE PLSEALSKRY LAYALSTIGS RALPDVRDGL KPVHRRVLHA 
MNNMRLNPEG GARKCAKVVG EVMGNFHPHG DQSIYDALVR LAQEFSQRVP LVDGQGNFGN 
IDGDSAAAMR YTECKMTAAA VLLLDGIDED AVDFKPSYDG QDEEPVVLPS GFPNLLANGS 
SGIAVGMATS IPPHNPAELI DACLLLLSKP EATTAEILER VPGPDFPTGG VIVESRESLL 
ETYETGRGGV RTRAKWEKED TGRGTYQIVV TEIPYQVKKS DLVEQLADLI DSKKAALLGD 
VRDESAEDIR LVLEPKSKNV EPEVLMESLF KLSALESRFP VNINVLDARG TPGVMGIKQA 
LIAFLAHRRD VLTRRARNRL SKIEARLHIL DGLLIAYLNL DEVIRIVRYE DEPKQKLMAA 
FALSDIQADA ILNTRLRQLA KLEEMEIRRE HAQLVEERDG ILAMLASDKK QWDLVGTGLR 
QVRAVLLKIK HPLDKTGRAT GVIGRSVFED APVVDAEAAL EALIVREPIT VILSDRGWIR 
AAKGKVEDPS ELKFKEGDKL GFLVPAETTD KLLLFTSDGR FFTIGCANLP SARGHGEPVR 
MMIELDDKVK IIDVFPFKAG RKRFLASKQG YGFLMPEEEA LANRKAGKQV LTVDAAGAAF 
CLEAVGDQLA VVGDNGKILI FPLEELPEMP RGKGVKLQSY REGGLRDAIS FNADVGAFWI 
DTAGRRRDWV EWRDWIGKRA GAGKLSPKGF PTSKRFRPK