Gene Sare_1316 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1316
Symbol
ID	5708394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1523727
End bp	1524929
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	74%
IMG OID	641270827
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001536208
Protein GI	159036955
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0850862
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGG CATACCTGGT GGCCGGTGTC CGCACCCCGA TTGGGAGGTA CGCTGGCGCG 
CTCGCCGGCG TCCGCCCCGA CGACCTGGCC GCGCACGTGA TCCGGGAGCT GGCCTCGCGG 
CACCCGACGG TGGACTGGGC CCGTACCGAC GACGTGATCC TTGGCTGCGC GAACCAGGCC 
GGCGAGGACA ACCGCAACGT GGCCCGGATG GCGGCGCTGC TCGGGGGGCT GCCCGAGCAG 
GTACCCGGCA GCACGGTCAA CCGGCTCTGC GGCTCCGGCC TGGACGCCCT CGCCGTCGCC 
GCCCGCTCCG TCGCCGCCGG TGAGGCCGAC CTGGTGGTCG CCGGCGGGGT GGAGAGCATG 
AGCCGGGCAC CGTTCGTGTT GCCCAAGGCC GAGACCGCGT TCTCCCGCAA CGCGGAAATG 
TACGACACCA CCATCGGCTG GCGGCTGGTC AACCCGTTGA TGGAGCAGGG GTGGGGCATC 
GACTCGATGC CGGAGACCGC GGAGAACGTG GCCGCCGAGT ACGGCGTCGG GCGCGCCGCG 
CAGGACGAGT TCGCGTACCG CTCGCAGCAG CGCGTGGCGA AGGCCCGGGC CGACGGCCGG 
TTCGCCGAGG AGATCGTGCC GGTGCGCGTT CCCGCCGGCC GCCGGGACAC GACGCTGGTC 
GAGGTCGACG AGCATCCACG GGAGACGTCG CTGGCGAAGC TGGCCGCACT GCCCACGCCG 
TTCCGGGCGG GAGGCACGAT CACCGCCGGC AACTCCTCCG GCGTCAACGA CGGGGCCGTG 
GCCCTGCTCG TCGCGTCCGA GGCGGCGGTC GCGCGGTACG ACCTGACCCC GTTGGCCCGG 
GTCGTGGGTG CCGCGGCGGC TGGCGTGCCG CCGCGGGTCA TGGGCATTGG CCCGGTGCCG 
GCCACCCGCC GGCTTCTCGG CCGGCTGGGC CTGGAACTGA GCGACCTGGA CGTGATCGAG 
CTGAACGAGG CGTTCGCCGC GCAGGCCGTG GCGGTGCTGC GGGACCTGGG CCTGCCGGAG 
GACGCCGAGC ACGTCAACCC GAACGGGGGC GCGATCGCGT TGGGGCATCC GCTCGGCGCG 
AGTGGTGCCC GGTTGGCACT GACCGCAGCC CTGGAACTGC GTCGCCGGGG TGGCCGGCGG 
GCACTGGCCA CCATGTGCGT CGGGGTCGGC CAGGGCGTTT CACTGCTGCT GGAGTCCGCC 
TGA

Protein sequence

MTVAYLVAGV RTPIGRYAGA LAGVRPDDLA AHVIRELASR HPTVDWARTD DVILGCANQA 
GEDNRNVARM AALLGGLPEQ VPGSTVNRLC GSGLDALAVA ARSVAAGEAD LVVAGGVESM 
SRAPFVLPKA ETAFSRNAEM YDTTIGWRLV NPLMEQGWGI DSMPETAENV AAEYGVGRAA 
QDEFAYRSQQ RVAKARADGR FAEEIVPVRV PAGRRDTTLV EVDEHPRETS LAKLAALPTP 
FRAGGTITAG NSSGVNDGAV ALLVASEAAV ARYDLTPLAR VVGAAAAGVP PRVMGIGPVP 
ATRRLLGRLG LELSDLDVIE LNEAFAAQAV AVLRDLGLPE DAEHVNPNGG AIALGHPLGA 
SGARLALTAA LELRRRGGRR ALATMCVGVG QGVSLLLESA