Gene Spro_3081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3081
Symbol
ID	5604353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	3390149
End bp	3391354
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	65%
IMG OID	640938622
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001479310
Protein GI	157371321
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.426252
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGG CGTTTATCTG CGATGGCGTT CGCACGCCGA TTGGCCGCTA CGGCGGCGCA 
TTGGCCAACG TGCGTGCCGA TGATTTGGCC GCTCTGCCGC TGCGTGCCCT GTTAGCTCGC 
CACCCACAGG TGGACTGGTC ATTGGTCGAT GATGTGATCC TCGGCTGCGC CAATCAGGCC 
GGGGAAGACA ACCGCAATCT GGCCCGGATG GCAGTATTGC TGGCCGGCCT GCCGGTGAAC 
GTTTCCGGCA CTACCGTCAA TCGCCTGTGC GGTTCGGGGC TGGACGCGCT GGCCATGGCG 
GCTCGCAGCA TCAAGGCCGG TGAAGCCGGG CTGGTGCTGG CCGGCGGCGC AGAATCAATG 
ACCCGCGCCC CGCTGGTGAT GGGCAAAGCC GACAGCGCTT TCAGCCGTCA GGCGCAACTG 
TATGACACCA CTCTGGGCTG GCGCTTTATC AATCCGCTGA TGCAGGCGCA GTTCGGCACC 
GACTCGATGC CGGAAACCGC CGAAAACGTG GCGGCGCAGT TCAACATCAG CCGCGCCGAT 
CAGGACGCCT TCGCGCTGCG CAGCCAGCAA CGCGCCGCCC GGGCGCAAGA GTCAGGTTTA 
CTGGCGCAGG AGATAGTGCC GGTCAGCCTC AGCGGTAAAA AAGGCGCGGT GACGTTGTTC 
AGCCAGGACG AACACCCGCG CGCAGACACC CGGCTGGAAC AATTGCAGGC GCTGAAAACG 
CCGTTCCGCC AACCCGGTAC CGTGACCGCC GGTAATGCCT CCGGCTTAAA CGACGGCGCA 
GCGGCGCTGA TTGTTGCCTC CGAGGCAATC GCCGTCAGTC AGGGCCTCAC CCCGCGGGCG 
CGTATCGTCG CCACCGCCAC CTGCGGCGTC GAACCCGGTT TGATGGGGAT CGGCCCACTG 
CCGGCCACCC GCAAGGTACT GGAGTTAGCC GGGCTAAGCC TGGCGCAAAT GGACGTGATC 
GAACTGAATG AGGCCTTTGC CGCCCAGGCG TTGGCGGTAC TGCGCCAGCT TGGCCTGCCG 
GACGACGCGC CGCAGGTGAA TCCCAACGGT GGCGCTATTG CCCTTGGCCA CCCGCTGGGG 
ATGAGCGGTG CACGCCTGGC GCTGGCCGCC TTGTTTGAAC TGGAACGGCG TTCCGGCCGC 
TACGCGCTTT GCACCATGTG CATCGGCGTC GGCCAAGGCA TCGCCATGAT CATTGAGCGA 
GTTTGA

Protein sequence

MSQAFICDGV RTPIGRYGGA LANVRADDLA ALPLRALLAR HPQVDWSLVD DVILGCANQA 
GEDNRNLARM AVLLAGLPVN VSGTTVNRLC GSGLDALAMA ARSIKAGEAG LVLAGGAESM 
TRAPLVMGKA DSAFSRQAQL YDTTLGWRFI NPLMQAQFGT DSMPETAENV AAQFNISRAD 
QDAFALRSQQ RAARAQESGL LAQEIVPVSL SGKKGAVTLF SQDEHPRADT RLEQLQALKT 
PFRQPGTVTA GNASGLNDGA AALIVASEAI AVSQGLTPRA RIVATATCGV EPGLMGIGPL 
PATRKVLELA GLSLAQMDVI ELNEAFAAQA LAVLRQLGLP DDAPQVNPNG GAIALGHPLG 
MSGARLALAA LFELERRSGR YALCTMCIGV GQGIAMIIER V