Gene Caul_4892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4892
Symbol
ID	5902354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5287283
End bp	5288200
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	71%
IMG OID	641565412
Product	histone deacetylase superfamily protein
Protein accession	YP_001686510
Protein GI	167648847
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGC CTTTCCCGCC CATCGTCCAC CATCCCGCCT TCCGCGCCGA GATGCCGGTC 
GGGCACCGGT TTCCGATGGA CAAGTTCTCG CGGCTGGCCG CCGTGCTGGA GGCGGAGGGC 
GTCGCGGGGC CGGCTGGTTT CGTGCGTCCC GAGCCGATCG ACGAGGACAG CCTGCGGCTG 
GTGCATGACG AGGCCTATGT GCGCGGCGTC ATCGACCTGA CCCTGCCCCC AGAGTTCGTG 
CGTCGCATCG GCATGCCCAA TACCGACTCC GTCGCCGCGC GGGCCCGGGC GGCGACCGGC 
GGCACCCTGG CGGCCGCGCG CCTGGCCCTG GAGCACGGCG TCGCCTGCAA CACCGCCGGC 
GGCAGCCACC ACGCCCAGGC CGACACCGGG GCGGGGTTCT GCGTGTTCAA CGACGTGGCG 
GTGGCGGCGC GGCGGCTCTT GGCCGAGGGA AAGGTGGGCC AGGTCCTGGT CGTCGATCTC 
GACGTCCACC AGGGCGATGG CACGGCGCGG ATCTTCGAGG GCGACGCTTC GGTCTTCACG 
TTCTCGATGC ACGCCGAAAA GAACTTCCCG GCCCGCAAGG CGACGAGCGA CCTGGACGTC 
AACCTGCCGG ACGGCACGGG CGACGAGGCC TATCTGGGAA AGCTCGGGGA ACTGCTGCCA 
GAGCTGCTGG CGCGGGTGGC GCCGGATCTG GTGTTCTTCA ACGCCGGGGT CGATCCGCAT 
GCGGACGACA AGCTGGGGCG GCTGAGTTTG AGCGACGAGG GGCTCGCGCG GCGCGAGGCG 
TTCGTCCTGG GCTCGTGTCT GGAAAGGGGG ATCCCGGTGA CCGGGGTGAT CGGCGGCGGA 
TATGACGCCG ACATCGATCG TCTGGCGCAT CGTCACGCCC TTCTCCACCG GGCGGCCCGC 
GAGGCCCTGA AGGCCTGA

Protein sequence

MATPFPPIVH HPAFRAEMPV GHRFPMDKFS RLAAVLEAEG VAGPAGFVRP EPIDEDSLRL 
VHDEAYVRGV IDLTLPPEFV RRIGMPNTDS VAARARAATG GTLAAARLAL EHGVACNTAG 
GSHHAQADTG AGFCVFNDVA VAARRLLAEG KVGQVLVVDL DVHQGDGTAR IFEGDASVFT 
FSMHAEKNFP ARKATSDLDV NLPDGTGDEA YLGKLGELLP ELLARVAPDL VFFNAGVDPH 
ADDKLGRLSL SDEGLARREA FVLGSCLERG IPVTGVIGGG YDADIDRLAH RHALLHRAAR 
EALKA