Gene TM1040_3026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3026
Symbol
ID	4076599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	3194450
End bp	3195625
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	60%
IMG OID	638008355
Product	beta-ketothiolase
Protein accession	YP_615020
Protein GI	99082866
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.345239
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.537231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGATA TTGTGATTCT GGATGGCGCC CGCACTGCGA TCGGAACCTT TGGTGGCGCG 
CTGGCCCAGA CGGCGCCGAT AGATCTTGGA GCGACGGTCG CCAAAGCTGC GATGGAGCGG 
TCTGGTGTCG ATCCTGCTCA GATCGGCACT GTTGTCTATG GTCATGTGAT CAACACCGAA 
CCACGTGATA TGTATCTGTC GCGGGTGGCA GCGATGCAGG CGGGAATTCC AGAAAGCACG 
CCTGCGATGA ATGTGAACCG CCTCTGCGGG TCCGGCGCGC AAGCCATCGT ATCAGGAATC 
CAAGCCTTGA TGCTGGGAGA TGCTGAATAC GCTCTGACCG GCGGAGCAGA AAGCATGTCG 
CGCAGTCCAT TCATCACGCC TTCGACCCGC TGGGGGCAAA AGATGGGTGA CGTGAAATCG 
CTCGACATGA TGCTGGGCGC TCTGAATTGC CCGTTTGGGA CTGGCCACAT GGGAGTGACG 
GCAGAGAATG TCGCAGATGA GCATGAGATC ACGCGCGCTC AGATGGATGA GTTCGCGCTG 
GTTAGCCAGA CCCGGGCCGC TGCCGCCATC GAGGCCGGCT ACTTCCAAAG CCAGATCGTG 
CCGGTTGATG TCAAGGTGAA GCGGGACATG GTTCCGTTCG AAGTCGATGA GCATCCAAAG 
GGCACATCGA TGGAGGCGCT CTCCGGGCTG CGTCCGGTGT TCAAGAAGGA TGGGCGTGTG 
ACGGCTGGCA ATGCGTCGGG AATCAACGAT GGCGCGGCTG CATTGGTGCT CGCCACAGCC 
GAGGCGGCTG AGAAATCCGG TCTGAAACCC AAGGCCCGTA TCCTCGGATA TGCCCATGCA 
GGCGTTCGTC CGGAGGTCAT GGGCGTAGGT CCGATTCCGG CTGTAGAGCA GCTTCTGAAG 
CGGATTGATA TGACTGTTGG TGACTTTGAC CTCATTGAAT CCAACGAGGC CTTTGCGGCG 
CAGGCTCTGG CCGTCAACAA GGCACTTGGG TTGGACAGTG CCAAGGTAAA TCCGAATGGC 
GGCGCAATTG CCCTGGGCCA TCCGGTCGGC GCAACCGGCG CCATCATCAC TGTCAAAGCG 
CTCTATGAGC TGGAGCGCAC TGGCGGGCGC CGTGCGATCA TCACCATGTG TATCGGGGGC 
GGGCAGGGGA TCGCCCTCGC GATCGAACGG ATCTGA

Protein sequence

MTDIVILDGA RTAIGTFGGA LAQTAPIDLG ATVAKAAMER SGVDPAQIGT VVYGHVINTE 
PRDMYLSRVA AMQAGIPEST PAMNVNRLCG SGAQAIVSGI QALMLGDAEY ALTGGAESMS 
RSPFITPSTR WGQKMGDVKS LDMMLGALNC PFGTGHMGVT AENVADEHEI TRAQMDEFAL 
VSQTRAAAAI EAGYFQSQIV PVDVKVKRDM VPFEVDEHPK GTSMEALSGL RPVFKKDGRV 
TAGNASGIND GAAALVLATA EAAEKSGLKP KARILGYAHA GVRPEVMGVG PIPAVEQLLK 
RIDMTVGDFD LIESNEAFAA QALAVNKALG LDSAKVNPNG GAIALGHPVG ATGAIITVKA 
LYELERTGGR RAIITMCIGG GQGIALAIER I