Gene Caul_1696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1696
Symbol
ID	5899151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1784405
End bp	1785607
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	73%
IMG OID	641562186
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001683323
Protein GI	167645660
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.142195
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CCTTCATCTG CGACGCCATC CGCACGCCGA TCGGCCGCTA CGGCGGGGCG 
CTGTCCAGCG TGCGGGCCGA CGACCTGGCG GCGCTGTCGA TCAGGGCGCT GATCGCCCGC 
AACCCCGGCG TGGACTGGGG CGCGCTGGAC GACGTGGTGC TGGGCTGCGC CAACCAGGCC 
GGCGAGGACA ACCGCAACGT CGCGCGCATG GCCGCCCTGC TGGCCGGACT GCCGGCCACC 
GCCCCCGGTT CGACCGTCAA CCGGCTTTGC GGATCGGGCC TCGACGCCCT GGGCGTGGCG 
GCGCGGGCCA TCAAGGCGGG CGAGGCCCAC CTGATGATCG CCGGCGGCGT CGAGAGCATG 
AGCCGCGCGC CGTTCGTGAT GGGCAAGGCC GACAGCGCCT TCTCGCGCAA CGCCGAGATC 
TTCGACACCA CCATCGGCTG GCGGTTCGTC AATCCGGCCA TGCGCAAGGC CTATGGCGTC 
GACTCCATGC CCGAGACCGC CGAGAACGTC GCCGACGCGT GGAAGGTCAC GCGCGCCGAC 
CAGGACGCCT TCGCTCTGCG CAGTCAGGCC CGCGCGGCGG CCGCCCAGGC CTCGGGCCGC 
TTCGACGTCG AGATCGCGCC GGTCACCCTG CCGCATCGCA AGGGCGACCC GGTCGTCGTG 
TCCAGGGACG AGCATCCGCG CGCCACGACG ATCGAGACGC TGGCGTCGCT GAAACCCATC 
GTCCGCCCGG ACGGCACGAT CACCGCCGGC AACGCCTCGG GCGTCAACGA CGGGGCGGCG 
GCGCTGATCG TCGCTTCGGA AGCGGCGGCC AAGGCCCATG GCCTGACGCC GCGCGCCCGC 
ATCCTGGGCG TCGCCGCCGC CGGGGTGGAG CCGCGCGTCA TGGGGATCGG ACCCGGGCCG 
GCGACCCAGA AACTGCTGGC GCGGCTTGGC CTCTCGATCG GCGACATCGA CGTGGTTGAG 
CTGAACGAAG CCTTCGCGGC GCAGGGCCTG GCGGTGCTGC GCGACCTGGG CCTGCCCGAC 
GACGGCGAGC ACGTGAACCC CAACGGCGGC GCCATCGCCC TGGGTCATCC GCTGGGCATG 
AGCGGCGCCC GGCTGGGCCT GACCCTGGTG GAGGAGCTCC ACCGGCGCGG CGCGCGGTAC 
GGCCTAGCGA CCATGTGCAT CGGCGTGGGC CAGGGCATCG CGATGGTGGT CGAGCGAGTC 
TAG

Protein sequence

MTDAFICDAI RTPIGRYGGA LSSVRADDLA ALSIRALIAR NPGVDWGALD DVVLGCANQA 
GEDNRNVARM AALLAGLPAT APGSTVNRLC GSGLDALGVA ARAIKAGEAH LMIAGGVESM 
SRAPFVMGKA DSAFSRNAEI FDTTIGWRFV NPAMRKAYGV DSMPETAENV ADAWKVTRAD 
QDAFALRSQA RAAAAQASGR FDVEIAPVTL PHRKGDPVVV SRDEHPRATT IETLASLKPI 
VRPDGTITAG NASGVNDGAA ALIVASEAAA KAHGLTPRAR ILGVAAAGVE PRVMGIGPGP 
ATQKLLARLG LSIGDIDVVE LNEAFAAQGL AVLRDLGLPD DGEHVNPNGG AIALGHPLGM 
SGARLGLTLV EELHRRGARY GLATMCIGVG QGIAMVVERV