Gene Strop_1359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1359
Symbol
ID	5057812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	1528107
End bp	1529312
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	74%
IMG OID	640473628
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001158204
Protein GI	145593907
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.755858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGG CATATCTGGT GGCTGGTGTC CGTACTCCGA TCGGGAGGTA TGCCGGGGCG 
CTCGCCGGCG TCCGCCCCGA TGACCTGGCC GCGCATGTGA TCCGGGAGCT GCTCGCCCGG 
CACCCGACGG TGGACTGGGC CCGTACCGAC GACGTGATCC TCGGCTGCGC GAACCAGGCC 
GGTGAGGACA ACCGCAACGT GGCCCGGATG GCGGCGCTGC TCGGCGGGCT GCCCGAGCAG 
GTGCCCGGGA GCACGGTCAA CCGGCTCTGC GGCTCCGGCC TGGACGCCCT CGCCATCGCC 
GCCCGCTCCA TCGTCGCCGG TGAGGCCGAC CTGGTGGTGG CCGGCGGGGT GGAGAGCATG 
AGCCGGGCGC CGTTCGTGTT ACCCAAGGCT GAGACCGCGT TCTCCCGCAA CGCGGAGGTC 
TACGACACCA CCATCGGCTG GCGGCTGGTC AACCCGGTGC TGGAGCAGGG GTGGGGCATC 
GACTCGATGC CGGAGACCGC GGAGAACGTC GCTGCCGAGT ACGGCGTCGC GCGTGCCACG 
CAGGACGAGT TCGCGTACCG CTCCCAGCAG CGCGTGGCGC AGGCGCAGGC CGACGGCCGG 
TTCGCCGAGG AGATCGTGCC GGTGCCCGCT CCCGCCGGCC GGCGGGGGAC GACGGTGGTC 
GAGGTCGACG AGCATCCGCG GGAGACGTCG CTGGCGAAGC TGGCCGCGCT GCCCACCCCG 
TTCCGGGTGG GGGGCACGAT CACCGCCGGC AACTCTTCCG GCGTCAACGA CGGCGCGGTG 
GCGCTGCTGG TGGCGTCCGA GGCAGCACTC ACGCGGTACG ACCTGACCCC GTTGGCCCGG 
GTCGTCGGCT CCGCCGCGGC CGGTGTGTCG CCACGGGTGA TGGGCGTCGG CCCGGTGCCG 
GCCACCCGCC GGCTCCTCGA CCGGCACGGT CTGGGGGTGG GCGATCTGGA CGTGGTCGAG 
CTGAACGAGG CGTTCGCCGC GCAGGCGGTG GCCGTCTTGC GGGAACTGGG CCTGCCGGAG 
GACGCCGAGC ATGTCAATCC CAACGGGGGC GCGATCGCGT TGGGGCATCC GCTCGGCGCG 
AGTGGGGCCC GGCTGGCGCT GACCGCCGCC CTGGAGTTGC GTCGCCGGGG CGGCCGGCGG 
GCGCTGGCCA CCATGTGCGT CGGCGTGGGC CAGGGCATCT CGCTGCTGTT GGAGTCCGTG 
GGGTGA

Protein sequence

MTVAYLVAGV RTPIGRYAGA LAGVRPDDLA AHVIRELLAR HPTVDWARTD DVILGCANQA 
GEDNRNVARM AALLGGLPEQ VPGSTVNRLC GSGLDALAIA ARSIVAGEAD LVVAGGVESM 
SRAPFVLPKA ETAFSRNAEV YDTTIGWRLV NPVLEQGWGI DSMPETAENV AAEYGVARAT 
QDEFAYRSQQ RVAQAQADGR FAEEIVPVPA PAGRRGTTVV EVDEHPRETS LAKLAALPTP 
FRVGGTITAG NSSGVNDGAV ALLVASEAAL TRYDLTPLAR VVGSAAAGVS PRVMGVGPVP 
ATRRLLDRHG LGVGDLDVVE LNEAFAAQAV AVLRELGLPE DAEHVNPNGG AIALGHPLGA 
SGARLALTAA LELRRRGGRR ALATMCVGVG QGISLLLESV G