Gene Caul_1953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1953
Symbol
ID	5899408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2094465
End bp	2095652
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	66%
IMG OID	641562443
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001683580
Protein GI	167645917
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0102019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.550682
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTAGAC GAGAAGTGGT GCTCTGCGAT CCTGTCCGGA CCGCCATAGG AACCTATAAC 
GGCAGCCTGA AGTCCGTCCC GGCCGTCGAG CTTGGCGCAA CGGTTCTGCG CGAAACGCTC 
AAGCGGTCCA AGCTCGATCC CAACCGCCTG CAGAGCGTGG TCATGGGTAA TGTCGTTCAG 
GCCGGCAATA GGATGAACCC TGCCCGTCAG GCCACTATAC TTGGCGGCGC GCCGGTCGAG 
GTTCCCGCCA TGACGGTCAA CCGGGTTTGC GGATCGGGGG CCCAGGCGAT CGTTTCCCTG 
GCGCAAGAGG TCTTGCTTGG CTTGGTCGAA GCGGGCGTCG CGGGCGGCAT GGAGAACATG 
GACGCCGCCC CCTACCTGAT GACGAGCGGC CGCTGGGGCT ACCGAATGGG AGACGCCCAG 
ATCTACGACG CTATGCTCCA TGACGGACTC AACGACGCCT TTTCCAATCA GCATTCGGGG 
TGGCATACCG AGGATCTGGT CACGAAATAT CAAATCAGTC GCGACGACCA GGACCGCTGG 
GCGGCGGGCT CGCAGCAGCG CTTTTCGCAG GCGCAGGCGG CGGGGAGATT CGATGCTGAG 
ATTGTCGCCG TCGATATCAA GGGCAAAAAG GGGCCCGAGC CGTTTTCGCG CGACGAGCAC 
AATCGCCCCG ACACCACGCT TGAGAGCTTG GCCAGGCTAA GGCCCGCCTT CCGGACAGAT 
GGAACCATCA CGGCGGGCAA CGCGCCCGGC CTCAATACTG GAGCGGCGGC GATGATCGTC 
GCCGAACGCG CCTTTGCCGA GGCCCACGGC CTAACGCCCA TGGCCAGACT GGTCTCCTAT 
GGCGTGGCGG CGGTCGAGCC CGGCCTGTTC GGCATCGGCC CCGTCCCTGC GGTCAGGCAG 
GCCTTGGCGC GGGCCGGGTG GACGGTCGGC GACATCGAGC GGATCGAGAT CAACGAGGCT 
TTCGCCGCCA TCGCGCTCGC GGTCACGCGC GAGCTTGGGC TTGCCGAGGA CATCGTCAAT 
GTCGAAGGCG GCGCCATCGC CCATGGCCAT CCGATCGGCG CCACCGGGGC GATCCTGACG 
ACGCGCCTGT TGCACGCCAT GAAGCGTGAC GGGCTAAGGC GCGGCGTCGT CACCCTCTGT 
ATCGGCGGCG GCCAGGGCGT CGCCCTGGCG CTCGAAACGC TCGCTTGA

Protein sequence

MARREVVLCD PVRTAIGTYN GSLKSVPAVE LGATVLRETL KRSKLDPNRL QSVVMGNVVQ 
AGNRMNPARQ ATILGGAPVE VPAMTVNRVC GSGAQAIVSL AQEVLLGLVE AGVAGGMENM 
DAAPYLMTSG RWGYRMGDAQ IYDAMLHDGL NDAFSNQHSG WHTEDLVTKY QISRDDQDRW 
AAGSQQRFSQ AQAAGRFDAE IVAVDIKGKK GPEPFSRDEH NRPDTTLESL ARLRPAFRTD 
GTITAGNAPG LNTGAAAMIV AERAFAEAHG LTPMARLVSY GVAAVEPGLF GIGPVPAVRQ 
ALARAGWTVG DIERIEINEA FAAIALAVTR ELGLAEDIVN VEGGAIAHGH PIGATGAILT 
TRLLHAMKRD GLRRGVVTLC IGGGQGVALA LETLA