Gene Caul_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2551
Symbol
ID	5900006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2771776
End bp	2774004
Gene Length	2229 bp
Protein Length	742 aa
Translation table	11
GC content	68%
IMG OID	641563042
Product	polyphosphate kinase
Protein accession	YP_001684176
Protein GI	167646513
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0855] Polyphosphate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.183316
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG TCGTCGCCCT TGACCTGCCC GCCGCGCCGA CGCCGGCCGC GCCGGACCTG 
GCGGGCCTGC GGCTGGACGA CGAGCTGCTG GCCTCGCCCG AGCGGTTCTT CAACCGGGAA 
ACCTCGTGGC TGGCCTTCAA CCAGCGGGTG CTGGAGGAGA GCGGCAATCC GCGCCACCCG 
CTGCTGGAGC GGCTGCGGTT CCTGTCGATC TCGGCCAACA ATCTCGACGA GTTCTACATG 
GTCCGCGTGG CCGGGCTGAA GGGCCAGGTG CGCGAGGGCG TGCGGGTGGT CAGCCAGGAC 
GGGCTGACGC CGGGCGAGCA GCTGGCGCGG ATCAACGCCT CGGCCGCCGA GTTGATGGCC 
GAGCAGCAGA AGATCTGGCG CGAGGTGCGG GCCGAGCTGT GGGCCGAAGG CCTCAAGCTG 
CTGGACGCCA AGGACATCGT CGGCGCCGAC CGCGAGCGGG CCGAGGAGCT GTTCCTGACC 
CGGATGTTCC CGGTGCTGAC GCCCCTGGCC ATCGATCCGG CCCACCCCTT CCCGTTCATC 
CCGAACCTGG GCTTCTGCCT GGCGCTGAAG CTGCGGCGGA TCGTCGACGA CAAGCACCTC 
TACGCCCTGG TGCCGGTGCC CAGCCAGGTG CAGCGCTTCT GGGAGCTGTC GCAGGCGGCC 
GGGACCAGGA CCCGCAAGCG CGAGCGGCGG ATCGTGGCGC TGGAAAGCTT CATCATCCTG 
TTCCTGGGGC ACCTGTTCCC CGGCTACGAG GTCGAGGGCC GCGGCCTGTT CCGCCTGATC 
CGCGACAGCG ACCTGGAGAT CGAGGAAGAG GCCGAAGACC TGGTGCGCGA GTTCGAGGCG 
CGGCTGAAGA AGCGCCGCCT GGGCCGCGTG GTGCGGGTCA AGATCCAGAC CACCATGCCG 
GCCGACCTGC GCGACTTCAT CATCGAGGGC CTGCGCGCCG AGCCCGAGGA CGTGATCATC 
GTCGACGGCA AGCTGGGCCT GGCCCAGATG GCCGAGCTGA TCCCGCCCGA CCGTCCGGAC 
CTGAAGTTCA AGCCCTACAA CGCCCGCTTC CCCGAGCGGG TGCGCGACCA CGGCGGCGAC 
TGCTTCGCGG CGATCCGCGA GAAGGACATC CTGGTCCACC ACCCGTTCGA GAGCTTCGAC 
GTGGTGGTGC AGTTCATCCG CCAGGCGGCG CGCGACCCGG CCGTGCTGGC CATCAAGCAG 
ACGCTGTATC GCACCAGCAA GGACAGCCCG ATCGTCGCGG CCCTGATCGA GGCGGCCGAC 
AACGGCAAGA ACGTCACCGC CCTCGTGGAG ATCAAGGCCA GGTTCGACGA AGAAAACAAT 
TTGAAGTGGG CTCGAGATCT GGAGCGCGCC GGCGTCCACG TGGTGTTCGG CTTCGTCGAC 
TGGAAGACCC ACGCCAAGCT GTCGGTGGTG GTGCGGCGCG AGGGCGAGGC CCTGCGCACC 
TATTGCCACT TCGGCACCGG AAACTATCAC CCGCAGACGG CGAAGGTGTA CACCGACCTG 
TCGCTGTTCA CCTGCGATCC GGCCCTGGGG CGCGACGGCG GCAAGCTGTT CAACTTCATC 
ACCGGCTACG CTCAGCCGCA CGGGCTGGAA AAGCTGAGCT TCTCGCCCGA GACGCTGAAG 
CCGGACCTGC TGAGGATGAT CGCCCACGAG GCCCGCAACG CCCGCGACGG CAAGCCGGCG 
GCGATCTGGG CCAAGATGAA CGCCGTGGTC GACCCGCAGA TCATCGACGC CCTCTACAGC 
GCCAGCCAGG ACGGCGTGCA GATCGACCTG GTCGTGCGCG GCATCTGCTG CCTGCGCCCG 
GGCATCAAGG GGCTGTCGGA GAACATCCGG GTCAAGAGCA TCGTCGGACG GTTCCTGGAG 
CACGCCCGCG TCGTGGCCTT CGCCAACGGC GCCCCGATGC CCAGCGCCCA GACCCGGCTG 
TTCATCAGCT CGGCCGACTG GATGCCGCGC AACCTCGACC GCCGGGTCGA GAGCCTGGTT 
CCGCTGGAGA ACCCCACCGT GCACCAGCAG GTGCTCAACC AGATCATGGT CGCCAACCTC 
AACGACGAGG CCCAGAGCTG GAACCTGGAT GGAGAAGGAC GTTACGCCCG CGACCCGGCC 
TGGGACCGCA AGGGCGCCTT CTCGGCCCAC GAATACTTCA TGACCAATCC CAGCCTGTCT 
GGCCGGGGCC ACAAGGTGAA GGACCTGCCG CAGGCCTTCG ACCACGTGGG ACCGCGCAAG 
CGGGGATGA

Protein sequence

MTDVVALDLP AAPTPAAPDL AGLRLDDELL ASPERFFNRE TSWLAFNQRV LEESGNPRHP 
LLERLRFLSI SANNLDEFYM VRVAGLKGQV REGVRVVSQD GLTPGEQLAR INASAAELMA 
EQQKIWREVR AELWAEGLKL LDAKDIVGAD RERAEELFLT RMFPVLTPLA IDPAHPFPFI 
PNLGFCLALK LRRIVDDKHL YALVPVPSQV QRFWELSQAA GTRTRKRERR IVALESFIIL 
FLGHLFPGYE VEGRGLFRLI RDSDLEIEEE AEDLVREFEA RLKKRRLGRV VRVKIQTTMP 
ADLRDFIIEG LRAEPEDVII VDGKLGLAQM AELIPPDRPD LKFKPYNARF PERVRDHGGD 
CFAAIREKDI LVHHPFESFD VVVQFIRQAA RDPAVLAIKQ TLYRTSKDSP IVAALIEAAD 
NGKNVTALVE IKARFDEENN LKWARDLERA GVHVVFGFVD WKTHAKLSVV VRREGEALRT 
YCHFGTGNYH PQTAKVYTDL SLFTCDPALG RDGGKLFNFI TGYAQPHGLE KLSFSPETLK 
PDLLRMIAHE ARNARDGKPA AIWAKMNAVV DPQIIDALYS ASQDGVQIDL VVRGICCLRP 
GIKGLSENIR VKSIVGRFLE HARVVAFANG APMPSAQTRL FISSADWMPR NLDRRVESLV 
PLENPTVHQQ VLNQIMVANL NDEAQSWNLD GEGRYARDPA WDRKGAFSAH EYFMTNPSLS 
GRGHKVKDLP QAFDHVGPRK RG