Gene Acid345_2470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2470
Symbol
ID	4072094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2921106
End bp	2922281
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	62%
IMG OID	637984487
Product	3-ketoacyl-CoA thiolase
Protein accession	YP_591545
Protein GI	94969497
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.559901
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.822135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGAAG TAGTGATTGT ATCGGCCGTC CGGACGCCGG TCGGCAAGGC TTACAAAGGG 
ACGCTGCGGG CAACGCGGCC GGATGATCTG GGCGCGGTGG CGATCAAGGG CGCTCTGGAG 
CGGGTACCGC AACTCGACGT GCGCGAGATT GAAGACGTGA TCCTGGGCTG CGCCATGCCG 
GAGGCGGAAC AGGGCATGAA CGTGGCGCGC ATCGCTTCCC TGCGCGCGGG ATTGCCGGTC 
GAGTGCTCGG CGATGACGAT TAATCGTTTC TGCGCGTCGG GACTGCAGGC GATTGCGCTG 
GCGGCGGAGC GGATTCGCGG TGGCGGAGCG GAAGTGATCG TCGCAGGCGG TACCGAGAGC 
ATGACGATGG TGCCGATGGG CGGACATAAG TTCACGGCCA ATCCGTACCT GGTGGAGACG 
TATCCGGATT CGTATCTGTC GATGGGCTTG ACGGCGGAGC GGCTGGCGGT GCGCCACGGG 
ATCACGCGCG AGATGGCGGA CGAGTTCTCG TACAACAGCC ACAAGAAAGC CATTGCCGCG 
ATCGAGGCTG GGCGCTTCGA GGATGAGATC GTTCCGGTGC CGGTGACGTT CGTGACGCCG 
AACGGATCGA AGCCGAAGAA GCAGGAGATA TTGTTCAAGG TGGACGAAGG GCCGAGGGCC 
GACACGACGT TGGAAGCTCT GGCGGGATTG AAGCCGGCGT TCCACGTGAA GGGCACGGTG 
ACGGCGGGCA ATTCGTCGCA GATGTCGGAC GGGGCGGCGG CTGCGGTGGT GATGTCGGCG 
GAGCACGCGA AGAAATTGGG GATCAAGCCG CTCGCGAGGT TTGTGGCGTT CGCAACCGCG 
GGTTACAAGC CGGAAGAGAT GGGACTGGGG CCGGTGTTCG CGATTCCGAA GGCGCTGAAG 
ATCGCCGGGC TGAAGCTCGA GGACATTGAT GTGTTCGAGT TGAACGAGGC GTTCGCGGCG 
CAGGCGTTGT CGGTGATCAA GGAAGCGGGG ATTGATATCA ATAAGGTCAA TCCAAATGGC 
GGCGCGGTGG CGTTGGGGCA TCCGCTGGGA TGCACGGGAG CTAAGCTGAC GGCGACGATC 
ATTCGTGAAT TGAAGCGGCG CAATGGGAAG TACGGGATTG TGACGATGTG CGTCGGCGGA 
GGTATGGGTG CTGCGGGGAT TTTTGAAAAT CTTTAA

Protein sequence

MREVVIVSAV RTPVGKAYKG TLRATRPDDL GAVAIKGALE RVPQLDVREI EDVILGCAMP 
EAEQGMNVAR IASLRAGLPV ECSAMTINRF CASGLQAIAL AAERIRGGGA EVIVAGGTES 
MTMVPMGGHK FTANPYLVET YPDSYLSMGL TAERLAVRHG ITREMADEFS YNSHKKAIAA 
IEAGRFEDEI VPVPVTFVTP NGSKPKKQEI LFKVDEGPRA DTTLEALAGL KPAFHVKGTV 
TAGNSSQMSD GAAAAVVMSA EHAKKLGIKP LARFVAFATA GYKPEEMGLG PVFAIPKALK 
IAGLKLEDID VFELNEAFAA QALSVIKEAG IDINKVNPNG GAVALGHPLG CTGAKLTATI 
IRELKRRNGK YGIVTMCVGG GMGAAGIFEN L