Gene Acid345_3239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3239
Symbol
ID	4072574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3835897
End bp	3837096
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	637985260
Product	acetyl-CoA acetyltransferase
Protein accession	YP_592314
Protein GI	94970266
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.127109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCGT TTGAAGATGT CGTCATTGTT TCCGCCGTAC GCACCCCCAT CGCCAAGTTC 
CAGGGTGCCT TCTCTGACCT AACCGCCACC GACCTCGGCG CCATCGCTGT GCGCGAAGCC 
GTGAAGCGCG CCGGCATCAC CGACCTCAAC GCAGTCAACG AATGCATCAT GGGTAACGTG 
CTCCAGGCCG GTCTCGGACA AAATCCCGCG CGCCAGGCCG CGATCAAAGG TGGACTTCCA 
CCGCACGTCG GCGCCATGAC CATCAACAAG GTCTGCGGCT CCGGTTTGAA GTCCGTCGCT 
CTTGCCGCGC AAGCTATCCA GACCGAGAAT GCGCAGCTCG TCGTCGCCGG TGGAATGGAA 
TCCATGACCA ACGCTCCCTA CCTGCTGCCC ACCGCGCGCA AAGGCTTCCG CATGGGCAAC 
CAGACCGCGG TCGACTCCAT GATCAACGAC GGTCTCTGGG ATGTGTACAA CAACTACCAC 
ATGGGCCAGA CCGGCGAGAA CGTTGCCGAC AAATACAAAG TCACCCGCGA GCAGCAGGAT 
GAATACGCCG CCAACTCGCA TCGCAAAGCG ATTGAAGCGC AAAAGGCCGG CCGCTTCAAA 
GATGAAATCG TCCCTGTCCA ACTTCCATCG AAGAAGAAAG ACGCTCCCGC CGAATTCCTC 
GATCGCGACG AAGGCCCGCG CGAAGACAGC ACCGCGATCA GCCTCGCCAA GCTCAAACCC 
GCATTCAAGA AAGACGGCAG CGTAACTGCC GGCAATGCCT CGACGATCAA CGACGGCGCC 
GCCGCTCTCG TCGTCACCAG CGCCAGCAAA GCCAAAGCGC TCGGCCTCAA GCCGATGGTC 
CGCATCCTTG CGCAAGCCAC CAGCGGTCTC GAACCCGCAT GGGTCATGAT GGCCCCGGTA 
GATGCCGTCC GCCAGATCTG GGCCAAGACC GGTTGGTCCG CCAACGATGT CGATCTCTAC 
GAACTCAACG AAGCCTTCTC GGTCCAGTCC GTCGCGCTGG TCCAGGAGCT CGGTCTCGAC 
GCCTCGCGCG TCAACGTCAA CGGCGGCGCC GTCGCGTTAG GTCATCCCAT CGGCTGCAGC 
GGCGCGCGCG TGCTCACCAC TCTCATCTAC GAGATGATCC ACCGCAACGC CAAGCGCGGC 
ATCGCATCGC TCTGCCTCGG CGGCGGCAAT GCGGTCGCTA TGGCCGTCGA ACTCGTCTAG

Protein sequence

MASFEDVVIV SAVRTPIAKF QGAFSDLTAT DLGAIAVREA VKRAGITDLN AVNECIMGNV 
LQAGLGQNPA RQAAIKGGLP PHVGAMTINK VCGSGLKSVA LAAQAIQTEN AQLVVAGGME 
SMTNAPYLLP TARKGFRMGN QTAVDSMIND GLWDVYNNYH MGQTGENVAD KYKVTREQQD 
EYAANSHRKA IEAQKAGRFK DEIVPVQLPS KKKDAPAEFL DRDEGPREDS TAISLAKLKP 
AFKKDGSVTA GNASTINDGA AALVVTSASK AKALGLKPMV RILAQATSGL EPAWVMMAPV 
DAVRQIWAKT GWSANDVDLY ELNEAFSVQS VALVQELGLD ASRVNVNGGA VALGHPIGCS 
GARVLTTLIY EMIHRNAKRG IASLCLGGGN AVAMAVELV