Gene RPD_0320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0320
Symbol
ID	4020779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	368865
End bp	370073
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID	637960498
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_567459
Protein GI	91974800
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.970819
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACG TGTTTGTCTG CGACGCAGTG CGCACCCCGA TCGGCCGGTT CGGCGGGTCG 
CTCGCCCGGG TCCGCGCCGA CGACCTCGCC GCGGTTCCGA TCAAGGCGCT GATCGCCAGG 
CACCCCAATC TCGACTGGAG CGCGGTGGAC GAGGTGTTTT TCGGCTGCGC CAACCAAGCC 
GGCGAGGACA ACCGCAACGT CGCGCGGATG GCGGCGCTGC TGGCCGGCCT GCCGGATTCG 
GTGCCGGGCC AGACCCTGAA CCGGCTGTGC GCCTCGGGCC TCGACGCGGT CGGCGCCGCG 
GGCCGCGCGA TCCGCTCCGG CGAGATCGAT CTGGCTATCG CCGGCGGCGT CGAATCGATG 
ACGCGGGCGC CGTTCGTGCA AGGCAAGGCG ACCGAGGCGT TCTCGCGCCA GGCCGAGATT 
TTCGACACCA CGATCGGCTG GCGTTTCATC AACCCGCTGA TGAAGGCGCA ATATGGCGTC 
GACGCGATGC CGGAGACCGG CGAGAACGTC GCCGAGGAAT TCCAGATTTC GCGCGCCGAC 
CAGGACGCCT TCGCGATCCG CTCCCAGCAG CGCGCCGGCG CGGCGATCGC CGCGGGTTAT 
TTCGCCGAGG AGATCGCGCC GGTGTCGGCG CCGGGCGGCA AAGCGGGGCC GATCATCGTC 
GACAAGGACG AGCATCCGCG CCCGGAGACC ACGCTGGAAG GCCTCGCCAA GCTCAAGCCG 
ATCGTGCGCA ATCCCGGCAC GGTGACGGCC GGCAACGCCT CGGGCGTCAA TGACGGCGCA 
GCGGCGATCA TCGTCGCCTC CGAAGCCGCG GTGAAGAAAC ACGGGCTGAC GCCGCGGGCG 
CGCATTCTCG GCCTCGCCTC GGCCGCGGTG CCGCCGCGGA TCATGGGCAT CGGCCCGGTG 
CCGGCGACCC GCAAGCTGAT GGACCGGCTC GGCCTGAAGA TCAGCGATTT CGACCTGATC 
GAACTCAACG AGGCGTTCGC CTCGCAGGGC ATCGCCTGCC TGCGTCAGCT CGGCGTCGCC 
GACGATGCGG ATTTCGTCAA TCCGCATGGC GGCGCGATCG CGCTCGGCCA TCCGCTCGGC 
ATGAGCGGCG CGCGGCTGGC GCTGACAGCG GTGCACGGCA TGGAAAAGCG CGGCGGCAGG 
CTGGCGCTGG CGACGATGTG CGTCGGCGTC GGCCAGGGCG TCGCGATGGC GATCGAGAAG 
TTGAACTAA

Protein sequence

MADVFVCDAV RTPIGRFGGS LARVRADDLA AVPIKALIAR HPNLDWSAVD EVFFGCANQA 
GEDNRNVARM AALLAGLPDS VPGQTLNRLC ASGLDAVGAA GRAIRSGEID LAIAGGVESM 
TRAPFVQGKA TEAFSRQAEI FDTTIGWRFI NPLMKAQYGV DAMPETGENV AEEFQISRAD 
QDAFAIRSQQ RAGAAIAAGY FAEEIAPVSA PGGKAGPIIV DKDEHPRPET TLEGLAKLKP 
IVRNPGTVTA GNASGVNDGA AAIIVASEAA VKKHGLTPRA RILGLASAAV PPRIMGIGPV 
PATRKLMDRL GLKISDFDLI ELNEAFASQG IACLRQLGVA DDADFVNPHG GAIALGHPLG 
MSGARLALTA VHGMEKRGGR LALATMCVGV GQGVAMAIEK LN