Gene Caul_3239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3239
Symbol
ID	5900694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3498783
End bp	3499979
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	68%
IMG OID	641563744
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001684864
Protein GI	167647201
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.672752
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.733298
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG GCATCAAGGA TAGGGTGGCC ATCCTGGGCA TGGGATGCGC CAAGTTCGGC 
GAGCGTTGGG ACGCCGACGG TCCCAGCCTG ATGGTCGAGG CCTTTCAGGA GGCCATCGCC 
GACGCGGGCA TCGATCCGTC CCAGCTGCAG GCCGGTTGGT TTGGTCACGC GGGCAACGCC 
GTGGGGCCAG GGGCGATCCC GCTGTCGATC GCCCTTCGTC TGCACAATGT GCCGGTGACG 
CGGGTCGAGA ACGCCTGCGC CACCGGCACC GAGGCGTTGC GCGGCGCGGC CTATGCGGTG 
GCCAGCGGCG CGTGCGACTT CGCCTTCGCC CTCGGCATGG AAAAGCTCAA GGACGCCGGA 
TACGGCGGTC TGCCGGCCGC CTCGCGCGGA CCCTTCTATG ACGCGACCAA CGCCAATCTC 
ACCGCGCCCG GCGCCTTCGC CCAGCTGGCG TCGGGTTATG GATCCAAGCA CGGCGTCGAG 
GCCGGCGACC TCAAGCGCGC CATGGCCCAT ATCTCGGTCA AGAGCCACGC CAACGCCGCC 
AAGAATCCCA AGGCTCACCT GCGCAAGCCG ATCACGATGG ACCAGGTGCT GTCGGCCCCC 
ATCATCGCCC AGCCCCTGGG CCTCTACGAC TGCTGTGGCG TTTCCGACGG CGCCGCGTGC 
GCCATCGTCA CCACGCCGGA AATCGCCCGC GCCCTCGGCA AGAAGGACAT CGTGACGATC 
AAGGCCCTGC AGCTGGCGGC GACCGGGGGG TGGGAGGCGC AGGGCGTCGG CTGGGACTAC 
AGCTATGTGC CGACCACCCG GGCCGCCGCG GCGCGCGCCT ATGCCGAGGC GGGCATCAGC 
GACCCGCAAA GGGAGCTGAG CCTGACCGAG GTGCACGACT GCTTTTCAAT CACCGAACTG 
GTGACCATGG AAGACCTCGG CTTGAGCCTC GAGGGGCAGG CCTATCGCGA CGTGCTCGAC 
GGCAAGTTCG ACGCCGACGG CAAGATCCCG TGTCAGATCG ATGGCGGTCT GAAGTGCTTT 
GGTCACCCCA TCGGCGCCAC CGGCATCCGC ATGGTCTACG AGAACTACCT GCAGCTTCTG 
GGGCGGGCCG GACCCCGCCA GCGCAGCGCG CCGGTGATCA ACGCCCTGGC CCACAATCTG 
GGCGGCGCGC CATTCCACGG CATTTGCTCG ATCTCCATCG TGGGTCTTCT GCGCTAG

Protein sequence

MASGIKDRVA ILGMGCAKFG ERWDADGPSL MVEAFQEAIA DAGIDPSQLQ AGWFGHAGNA 
VGPGAIPLSI ALRLHNVPVT RVENACATGT EALRGAAYAV ASGACDFAFA LGMEKLKDAG 
YGGLPAASRG PFYDATNANL TAPGAFAQLA SGYGSKHGVE AGDLKRAMAH ISVKSHANAA 
KNPKAHLRKP ITMDQVLSAP IIAQPLGLYD CCGVSDGAAC AIVTTPEIAR ALGKKDIVTI 
KALQLAATGG WEAQGVGWDY SYVPTTRAAA ARAYAEAGIS DPQRELSLTE VHDCFSITEL 
VTMEDLGLSL EGQAYRDVLD GKFDADGKIP CQIDGGLKCF GHPIGATGIR MVYENYLQLL 
GRAGPRQRSA PVINALAHNL GGAPFHGICS ISIVGLLR