Gene Sare_2841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2841
Symbol
ID	5708015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3226423
End bp	3227601
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	71%
IMG OID	641272297
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001537667
Protein GI	159038414
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.623235
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.130609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGAA CGGCCGTGCT GGGAACCGGG CAAACACAGC ACCAGACACG GCGCACCGAC 
GTGTCGATGG CCGGGCTGTG CCGGGAGGCG ATCGACCGCG CGCTGGCCGA CGCCGGCGTC 
GACTGGCCGC AGATCGACGC GGTGGTGCTG GGCAAGGCAC CGGACCTGTT CGAAGGTGTG 
ATGATGCCGG AGCTGTTCCT CGCCGACGCG CTGGGAGCCG CCGGCCGCCC GCTGCTGCGG 
GTGCACACGG CCGGCTCCGT GGGCGGCGCC ACCGCGATCG TGGCGACCAG CCTGGTCCGG 
GCCGGCGTGC ACCACCGTGT GCTCGCGGTC GCGTTCGAGA AGCAGTCGGA ATCCAACGCC 
ATGTGGGCGC TGTCCATCCA GCCGCCCTTC ACCGCACCGA TCGGGGCCGG GGCCGGTGGA 
TACTTCGCGC CGCACGTCCG CGCCTACATT CGGCGCTCGC ACGCGCCCGA GCACATCGGC 
GCGCTGGTCG CGGTGAAGGA CCGACGCAAC GGCGCCCTCA ACCCGTACGC CCACCTGCGC 
CAGCCGGACA TCACGCTGGA GTCGGTACGG GCGTCGCGGA TGCTGTGGGA TCCGATCCGG 
TACGACGAGA CCTGCCCCTC CTCCGACGGT GCCTGTGCCA TGGTGATCGG CGACCAGGCG 
GCAGCCGAGG CGAGCGAGCG TCCGGTGGCC TGGATCCGGG CTACCGTGAT GCGCACCGAA 
CCGACCTACT TCGCCGGGAA GGACCACGTC AACCCGAGGG CTGGTGCGGA GGCGGCCCAG 
GCGCTGTGGC AGGCGGCTGG CATCACCGAC CCCCTCGATG AGGTCGACGT CGCCGAGTTG 
TACGTGCCCT TCTCCTGGTT CGAGCCGATG TGGCTGGAGA ACCTCGGCTT CGCCGAGGCG 
GGGCACGGCT GGAAGCTCAC CGAGTCGGGT GAGACCCGGA TCGGCGGGCG GCTGCCGGTC 
AACCCGTCCG GCGGGGTGTT GTGTTCCAAC CCGATCGGTG CGTCCGGCAT GCTCCGTTTC 
GCCGAGGCGG CCACGCAGGT GATGGGGCGG GCCGGCGAAC GTCAGGTAGC CGGGGCACGC 
ACGGCGCTCG GCCACGCGTA CGGCGGCGGA TCGCAGTTCT TCTCGATGTG GGTCGTCAGC 
GATACCGCAA CGGCACGCTC CGTGACTCCC CGCAACTGA

Protein sequence

MRRTAVLGTG QTQHQTRRTD VSMAGLCREA IDRALADAGV DWPQIDAVVL GKAPDLFEGV 
MMPELFLADA LGAAGRPLLR VHTAGSVGGA TAIVATSLVR AGVHHRVLAV AFEKQSESNA 
MWALSIQPPF TAPIGAGAGG YFAPHVRAYI RRSHAPEHIG ALVAVKDRRN GALNPYAHLR 
QPDITLESVR ASRMLWDPIR YDETCPSSDG ACAMVIGDQA AAEASERPVA WIRATVMRTE 
PTYFAGKDHV NPRAGAEAAQ ALWQAAGITD PLDEVDVAEL YVPFSWFEPM WLENLGFAEA 
GHGWKLTESG ETRIGGRLPV NPSGGVLCSN PIGASGMLRF AEAATQVMGR AGERQVAGAR 
TALGHAYGGG SQFFSMWVVS DTATARSVTP RN