Gene Rsph17025_2833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2833
Symbol
ID	5085111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2883608
End bp	2884807
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	640484403
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_001169024
Protein GI	146278865
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.164293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGG TCTTCATCTG CGACTATATC CGCACCCCCA TCGGCCGCTA CGGCGGGGTG 
CTCTCCTCCG TCCGCGCGGA CGATCTGGGG GCGGTGCCGC TGAAGGCCCT GATGGCCCGC 
AACGGCGCCG TGGACTGGGA GGCGGTGGAC GACGTGATCT TCGGCTGCGC CAATCAGGCG 
GGCGACGACA ACCGCAACGT GGCGCGCATG TCGGCGCTGC TGGCTGGGCT GCCGGTCGGA 
GTCAGCGGCA CGACGATCAA CCGGCTCTGC GGCTCGGGCA TGGACGCCGT GCTGATCGCC 
GCCCGCCAGA TCGCGGTGGG CGAGGCGGAA CTGGTGATCG CGGGCGGCGT CGAGAGCATG 
TCGCGCGCGC CCTTCGTGCT TGCCAAGGCC GGGACCGCCT TCTCGCGCAC GGCCGAGATC 
CACGACACCA CCATCGGCTG GCGCTTCGTC AATCCGGCGA TGGAGGCGGC CCACGGCGTC 
GAGTCCATGC CGCAGACCGG GCAGAATGTC GCCGGCGATT TCGGCATCGG CCGCGAGGCG 
CAGGATGCGA TGGCCCTCGC CTCGCAGGTG AAGGCGGCGG CGGCGCAGGC GAGCGGGCGG 
CTTGCGCAGG AGATCACGCC GGTCCTCGTT GCGCAGCGCA AGGGCGAGCC GATCCCGGTC 
GAGCGCGACG AGCATCCGCG GGCAACGACG ATCGAGGCGC TGGCAAGGCT CAAGCCGCTC 
TTTCCGGGCG GATCGGTCAC GGCGGGCAAT TCCAGCGGCG TCAACGACGG CGCGGCGGCG 
CTGATCCTCG CGACCGAGGA CGCGGCCCGG CGCCACGGGC TCACGCCCAT CGCGCGCGTG 
CTGGGGGGGG CCACGGCCGG CGTCCCGCCG CGGATCATGG GCATGGGCCC CGTGCCCGCC 
GCGCGGAAGC TGATGGCCCG GCTCGGGCTG ACGGAGGCGG AGTTCGACGT GATCGAACTG 
AACGAGGCCT TCGCCGCACA GGCTGTTGCG ACGCTCCGGC ACCTGGGCAT TTCCGATGAC 
GATGCGCGGG TGAACCCGAA CGGGGGCGCC ATCGCGCTCG GTCATCCTCT GGGCATGTCG 
GGCGCGCGTC TCATCGGAAC CGCCGCGCTC CAGCTCCAGC TCTCCGGCGG GCGCCGGTCG 
CTCTCGACCA TGTGCGTCGG CGTGGGTCAG GGCATTGCGG TGGCCCTCGA GCGGGTGTGA

Protein sequence

MTEVFICDYI RTPIGRYGGV LSSVRADDLG AVPLKALMAR NGAVDWEAVD DVIFGCANQA 
GDDNRNVARM SALLAGLPVG VSGTTINRLC GSGMDAVLIA ARQIAVGEAE LVIAGGVESM 
SRAPFVLAKA GTAFSRTAEI HDTTIGWRFV NPAMEAAHGV ESMPQTGQNV AGDFGIGREA 
QDAMALASQV KAAAAQASGR LAQEITPVLV AQRKGEPIPV ERDEHPRATT IEALARLKPL 
FPGGSVTAGN SSGVNDGAAA LILATEDAAR RHGLTPIARV LGGATAGVPP RIMGMGPVPA 
ARKLMARLGL TEAEFDVIEL NEAFAAQAVA TLRHLGISDD DARVNPNGGA IALGHPLGMS 
GARLIGTAAL QLQLSGGRRS LSTMCVGVGQ GIAVALERV