Gene Caul_0555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0555
Symbol
ID	5898010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	605239
End bp	606378
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	63%
IMG OID	641561037
Product	histone deacetylase superfamily protein
Protein accession	YP_001682186
Protein GI	167644523
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGCA CCGGATTTGT CTGGAATGAG AAGTTCGCCT GGTTCGAGCT TCAGGCCTAC 
GGCGGGGTCG TACGCGGCGG GGTCGACTCG ATGCAGCCAG ATCGGCACGT TTACGATCCG 
GAGGTCGTTA GACGATTCCG CAACCTCGTT GACGTGAGTG GGCTTCTGAA GAAGCTCGTG 
GACATTCCAG CGCGTCTTGC CACGGGGCTC GAAATCGGGC GCGTCCACAC CAGCGATCAC 
ATCAACCAGA TCAAGATCAT GTCGGGCTTC CCGACAGGTG GGGAACCTGG GGATGACGCT 
CCGGTGCCGT ATGGGGCCTT CGAGATTGCG TCGCTGGCCG CCGGTGGGGC GATCGCCGCC 
GTGGATGCTG TCATGAGCGG CGAGGTCGAC AACGCCTATG CCCTCCTCAG GCCGGCCGGG 
CATCACTCCA GGCCGGACCG TTCGATGGGA TTTTGCATCT TCTCGAACGC AGCGATCGCC 
GGGCGCCATC TCCTCGACTT CCATAATGTG AAGCGGATCG CCTACGTCGA TTGGGATGTG 
CATCACGGCA ACGGCACTCA GGCGGCGCTC TACAACGAGC CTCGGGCGCT GACGATCTCA 
ATCCACCAGG ACCGCCTCTA TCCCGTCGAC GATGGGTTCG TGGACCAGAT CGGCGAGGGG 
GCGGCTGAAG GCACCAATCT TAATATTCCG CTGCCCCCGG GCTGCGGCGC TGAGGCGTAC 
TGCGCGGCCT ACGACCGTGT CGTCATCCCT GCCCTGCAGG CGTTCCGACC CGAGATCATC 
ATCGTCCCCA GCGGCTTTGA TGCTGGGGCC ATGGATCCCA TGGGGCGGAT GATGATGCAC 
TCCGACGGGT ACCGCCAACT CACGCGAAAG CTCATGGCGA CGGCCGATGA GTTGTGTGGC 
GGCCGCCTGG TGTTCCTCCA CGAGGGAGGT TACTCGCGCT GGACCGTGCC CTACTTCGGG 
TTGGCCGTGC TCGAGGAGCT CTCCGGAATT TCGACCGGAA CGTCTGATCC TCACCTCGAG 
TATCACAAGG CGCTCGGCGG GCAGGAACTT CTACCGCATC AGACCGAGGC TATCGACGCT 
GCGGCGGCGA ACCTTGCGCG AGTTCCGCAG TTCGCCTGCC CGACAGGCGT GGCCGACTGA

Protein sequence

MRRTGFVWNE KFAWFELQAY GGVVRGGVDS MQPDRHVYDP EVVRRFRNLV DVSGLLKKLV 
DIPARLATGL EIGRVHTSDH INQIKIMSGF PTGGEPGDDA PVPYGAFEIA SLAAGGAIAA 
VDAVMSGEVD NAYALLRPAG HHSRPDRSMG FCIFSNAAIA GRHLLDFHNV KRIAYVDWDV 
HHGNGTQAAL YNEPRALTIS IHQDRLYPVD DGFVDQIGEG AAEGTNLNIP LPPGCGAEAY 
CAAYDRVVIP ALQAFRPEII IVPSGFDAGA MDPMGRMMMH SDGYRQLTRK LMATADELCG 
GRLVFLHEGG YSRWTVPYFG LAVLEELSGI STGTSDPHLE YHKALGGQEL LPHQTEAIDA 
AAANLARVPQ FACPTGVAD