Gene Spro_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3039
Symbol
ID	5604120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	3347791
End bp	3348993
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	61%
IMG OID	640938580
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001479268
Protein GI	157371279
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCCG CTTACCTGTG TGATGCCGTC CGTACGCCTT TTGGTCGACT CAACGGCAGC 
CTGGCCAGCA TTCGCGCCGA CGACCTGGCC GCCCTGCCGC TCAAAGCGTT GCAGGCGCGC 
CACCCACAAC TTGACTGGGC GGCAGTGGAC GACGTGCTGC TTGGCTGTGC CAATCAGGCC 
GGAGAGGATA ACCGCAACGT GGCGCGCATG GCGTTGCTGC TGGCCGGGCT GCCGGTACAG 
ATCCCCGGTT GTACCCTCAA CCGCCTGTGC GGCTCCAGTC TGGACGCCGT GGCGATGGCG 
GCCCGGGCGA TCAAAACCGG CGAAAGTGAA CTGATGATCG CCGGCGGTGT AGAAAGCATG 
TCCCGTGCGC CCTTCGTGAT GGGCAAGGCG GAAAGCGCCT TCAGCCGAAT GATGAAACTG 
GAAGACACCA CCATGGGCTG GCGGTTTATC AACCCACAGA TGCAGGCGCT ATATGGCGTG 
GAGTCGATGC CGCAAACCGC CGAAAACGTC GCCCTCAAAT TCGGGATTAA CCGCCAGGAT 
CAGGACGCCT TTGCCCTGCG CAGCCAGCAG CGCACCGCTA GCGCGCAGGA AAGCGGCTTT 
TTCGCCGAAC AGTTGATTGA AGTCAGCGTT GCGCAGAAAA AAGGTGCACC GTTACTGTTC 
ACTCAGGACG AACACCCGCG CGCCACCACG CTGGAAGCCC TGTCGAAGCT GAAACCGGTG 
GTTAACCCTC AGGGAACAGT GACCGCCGGT AATGCTTCCG GGCTGAACGA CGGTACCTGC 
GCGCTGCTGC TGGCCAGCGA AACCGGGATG ACTCGCCACG GACTGCAACC CATGGCCCGT 
ATTATCGCCA GCGCCGTTAC CGGTATTGAG CCTTCAATTA TGGGCTTTGC CCCGGCTCAA 
GCGGTACGCA AGGTATTAAA AATTGCCGGG CTGAGCCTCG ACCAAATGGA CGTGATTGAG 
CTTAACGAAG CTTTTGCGGC ACAGGCATTG GCGGTGACGC GTGAACTGGG GCTGAGTGAC 
GACGCCGCTC AGGTGAATCC CAATGGCGGT GCGATCGCCC TCGGTCATCC GCTGGGTGCT 
TCCGGTGGCA GGCTGGTGAT GAACGCCGCC TGGCAATTGC AAAAGACGCG CGGCCGCTAT 
GGCTTGTGCA CTATGTGTAT TGGCGTCGGC CAGGGCATTG CACTGATTAT CGAACGGGTA 
TGA

Protein sequence

MIPAYLCDAV RTPFGRLNGS LASIRADDLA ALPLKALQAR HPQLDWAAVD DVLLGCANQA 
GEDNRNVARM ALLLAGLPVQ IPGCTLNRLC GSSLDAVAMA ARAIKTGESE LMIAGGVESM 
SRAPFVMGKA ESAFSRMMKL EDTTMGWRFI NPQMQALYGV ESMPQTAENV ALKFGINRQD 
QDAFALRSQQ RTASAQESGF FAEQLIEVSV AQKKGAPLLF TQDEHPRATT LEALSKLKPV 
VNPQGTVTAG NASGLNDGTC ALLLASETGM TRHGLQPMAR IIASAVTGIE PSIMGFAPAQ 
AVRKVLKIAG LSLDQMDVIE LNEAFAAQAL AVTRELGLSD DAAQVNPNGG AIALGHPLGA 
SGGRLVMNAA WQLQKTRGRY GLCTMCIGVG QGIALIIERV