Gene Apre_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1351
Symbol
ID	8398158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1452355
End bp	1453536
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	40%
IMG OID	644995713
Product	acetyl-CoA acetyltransferase
Protein accession	YP_003153095
Protein GI	257066839
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.428024
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAA AAGTAGTAAT AGCAAGTGCA GCAAGAACAC CCGTAGGAGC TTACGGCGGA 
GCATTCAAAA CAGTTTCAGC AAGAGAATTA GGTGCTGTAG CAGCTAAAGA AGCAATCAAA 
AGAGCAGGTA TCAAACCAGA AGATGTTGAT GAATCAATCC TAGGTTGTGT ACTTCAAGCA 
GGTAACGGTC AAAACATCGC TCGTCAAATC GCCCTTGATG CAGGTATTCC TAAAGAAAAA 
CCAGCTATGA CATTAAATAT AGTTTGTGGA TCAGGACTTA GAAGTGTATC TCTTGCAGCA 
CAAATGATTA TGGCAGGAGA TGACGATATA GTTCTTGCAG GTGGTACAGA ATCAATGTCT 
CAAGCTCCAT ACCTCCTAAC TGATGAAAGA TGGGGAGCAA GAATGGGAGA TAAGAAAGTT 
GTCGATGAAA TGATCAAAGA CGGACTTTGG GATGCATTCA ATGACTACCA CATGGGAGTT 
ACTGCAGAAA ATATAGCTGA AAAATTCGGC CTAACAAGAG AAGAACAAGA CGCACTTGCT 
GCAGACAGCC AACAAAAAGC TGCTAAAGCT AGAGCTGAAG GAAGATTCAA AGACGAAATA 
GTTCCAGTAG AAGTTAAAGG AAGAAAAGGA AAAGTAACTG TAGTTGATGA AGATGAATAC 
ATCAAAGAAG GCGTTACAAC AGAAAGTATC TCTAAACTAA GACCAGCTTT CATTAAAGAC 
GGTACAGTTA CAGCAGCTAA CGCATCAGGA ATCAACGATG GTGCAGCATG TCTTGTAGTA 
ATGAGCGAAG AAAAAGCAAA AGAGTTAGGT GTTAAACCAC TAGCTACAAT CGTAAGCTAC 
GCTACAGAAG GTGTTGATCC AAAAATCATG GGTACTGGTC CAATCCCAAC AGTTAGAAAA 
GCTCTAGAAA AAGCTGATCT TAAACTTGAA GATATCGACC TAATCGAAGC TAATGAGGCT 
TTCGCTGCTC AAGCTCTATC AGTAATCAAA GAACTTGGAT TAAATACAGA TATAGTTAAC 
GTTAACGGTG GTGCAATCGC AATTGGTCAC CCTGTTGGAG CAAGTGGAGC AAGAATCCTT 
ACAACACTTC TTTACGAAAT GCAAAAGAGA GACTCTAAAA AAGGTATCGC AACCCTATGT 
ATAGGTGGCG GTATGGGAAC AGCAGTAGTA GTAGAAAGAT AA

Protein sequence

MTKKVVIASA ARTPVGAYGG AFKTVSAREL GAVAAKEAIK RAGIKPEDVD ESILGCVLQA 
GNGQNIARQI ALDAGIPKEK PAMTLNIVCG SGLRSVSLAA QMIMAGDDDI VLAGGTESMS 
QAPYLLTDER WGARMGDKKV VDEMIKDGLW DAFNDYHMGV TAENIAEKFG LTREEQDALA 
ADSQQKAAKA RAEGRFKDEI VPVEVKGRKG KVTVVDEDEY IKEGVTTESI SKLRPAFIKD 
GTVTAANASG INDGAACLVV MSEEKAKELG VKPLATIVSY ATEGVDPKIM GTGPIPTVRK 
ALEKADLKLE DIDLIEANEA FAAQALSVIK ELGLNTDIVN VNGGAIAIGH PVGASGARIL 
TTLLYEMQKR DSKKGIATLC IGGGMGTAVV VER