Gene Caul_1897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1897
Symbol
ID	5899352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2035772
End bp	2036959
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	70%
IMG OID	641562387
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001683524
Protein GI	167645861
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.369761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCCGG TCTATATGGT CGCGGCCGTC CGCACGCCGA TCGGGCGGTT TCGCGGGGCG 
CTGGCTGGCG TACGCGCCGA TCATCTCGGC GCCCATGCGC TGAACGAACT GGTCGCCCGC 
GCCGGCGTGG GCGCCGAGCA TATCGACGAC GTGATCTTCG GATGCGTCAC CCAGGTTGGC 
GAGCAGTCGG CCAATATCGC CCGGACCTCG CTGCTCGGCG CGGGCTGGCC CGAGACGATC 
GGCGCCATGA CCGTCGATCG CAAATGCGGC TCATCGGAAG CGGCCATTCA TATCGCCGCC 
GCTCAGATCG CGGCGGGGCT GAGCGACCTG GTCGTCGCCG GCGGGGCCGA GTCGATGTCC 
CGCGTGCCGA TGGGGTCCAA CCGCTCCATC CACGGCGAAG CATTCGGCTG GATGGTCTCG 
GATCGCTATG AGTTGACCTC CCAGGGCGAG GCCGCCGAGC GGATCGCCGA CAAGTACGGC 
TTCGACCGAG ACGCGCTGGA CGATTTCGCC GCGGAGTCCC ATCGCCGCGC CGCCGCCGCG 
ACCGACGCGG GCTATTTCCG CGCCGAGACG GTCGCGGTCC CGGTCGCCGA CCTCTGCGAA 
AAGGACTGGG AAGGGCCGAA AGATAGCCTG GACGGTGATC AGACCATCCG CCGCGACACC 
AGCCGCGAGA AGCTCTCGAT GCTGAAGACC AGCTTCCGCG AGAACGGTCG CGTCACCGCC 
GGCAACGCCT CGCAGATTTC CGACGGCGCG GCGGTCGTGC TGCTGGCCTC CGAGGCGGCG 
GTCAAGCGGT TCGGCCTGAC CCCGCTGGCG CTGGTCCGCT CGGTCGCCGT CGTCGGCGCC 
GATCCGACCC TGATGCTGGA AGGCCCGATC GCCGCCAGTC GCAAGGCCGC CGCGTCCGCT 
GGCCTGTCGT TCGACGACAT CGCCCTGTTC GAGGTCAACG AGGCCTTCGC CAGCGTGCCC 
TTGATGTGGA TGCAGGCGAC CGGGGTCGGG GCGGATCGAC TGAACGTCAA CGGCGGCGCC 
ATCGCCTTGG GCCACCCCCT GGGCGCGACC GGCGCGCGCA TCGCCACCAG CCTTATCCAT 
GACCTGGTCC GCACCGGGCA GAAGTACGGG CTCCAGGCGA TTTGCTGCGC AGGGGGACTG 
GCGACGGCGA CGATCTACGA AAACCTGGCG CCCGCGCCGA CGGCCTAA

Protein sequence

MTPVYMVAAV RTPIGRFRGA LAGVRADHLG AHALNELVAR AGVGAEHIDD VIFGCVTQVG 
EQSANIARTS LLGAGWPETI GAMTVDRKCG SSEAAIHIAA AQIAAGLSDL VVAGGAESMS 
RVPMGSNRSI HGEAFGWMVS DRYELTSQGE AAERIADKYG FDRDALDDFA AESHRRAAAA 
TDAGYFRAET VAVPVADLCE KDWEGPKDSL DGDQTIRRDT SREKLSMLKT SFRENGRVTA 
GNASQISDGA AVVLLASEAA VKRFGLTPLA LVRSVAVVGA DPTLMLEGPI AASRKAAASA 
GLSFDDIALF EVNEAFASVP LMWMQATGVG ADRLNVNGGA IALGHPLGAT GARIATSLIH 
DLVRTGQKYG LQAICCAGGL ATATIYENLA PAPTA