Gene RPB_0525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0525
Symbol
ID	3909429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	586052
End bp	587260
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID	637882413
Product	beta-ketoadipyl CoA thiolase
Protein accession	YP_484147
Protein GI	86747651
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases [TIGR02430] beta-ketoadipyl CoA thiolase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.859351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACG TCTTCATCTG CGACGCAGTG CGCACCCCAA TCGGCCGGTT CGGCGGATCT 
CTCGCCAAAG TCCGTGCCGA CGACCTCGCC GCGGTTCCGA TCAAGGCGCT GATGGCCAAG 
CACCCCGATC TCGACTGGAG CGCGGTGGAC GAGGTGTTCT TCGGCTGCGC CAACCAGGCC 
GGCGAAGACA ACCGCAACGT CGCCCGGATG GCGACGCTGC TCGCGGGCCT GCCGGATTCG 
GTGCCGGCCC AGACCCTCAA CCGGCTGTGC GCCTCCGGGC TCGACGCGGT CGGCGCCGCG 
GGCCGCGCGA TCCGCGCCGG CGAGATCGAT CTGGCGATTG CCGGCGGCGT CGAATCGATG 
ACACGGGCGC CGTTCGTGAT GGGCAAAGCC GGCGAGGCGT TTTCCCGCCA GGCGGACATC 
TTCGACACCA CGATCGGCTG GCGTTTCATC AATCCGCTGA TGAAGGCGCA ATACGGTGTC 
GACGCGATGC CGGAGACCGG CGAGAACGTC GCCGAGGAAT TCCAGATTTC GCGCGCCGAT 
CAGGACGCCT TCGCGATCCG ATCCCAGCAG CGCGCAGGCG CCGCCATCGC CGCCGGTTAC 
TTCGCGCAGG AGATCGCGCC GGTGTCGGCG CCGGGCGGCA AGGCCGGTCC GATCATCGTC 
GACAAGGACG AGCATCCGCG CCCGGAGACG ACGCTGGAAG GCCTCGCCAA GCTGAAGCCG 
ATCGTGCGCA ATCCCGGCAC GGTGACCGCC GGCAACGCCT CGGGCGTCAA TGACGGCGCT 
GCGGCGATGA TCGTGGCCTC GGAGGCTGCG GTGAAGAAAC ACGGCCTGAC GCCCCGGGCG 
AAGATTCTCG GCCTCGCCTC GGCGGCAGTG CCGCCGCGCA TCATGGGCAT CGGCCCGGTG 
CCGGCGACCC GCAAGCTGAT GGAGCGGCTG GGGCTGAAGA TCTCCGACTT CGACCTGATC 
GAGCTCAACG AAGCCTTCGC CTCGCAGGGC ATCGCCTGCC TGCGCCAGCT CGGCGTCGCC 
GACGATGCCG ATTTCGTCAA TCCGCATGGT GGCGCGATCG CGCTCGGCCA CCCGCTCGGC 
ATGAGCGGCA CGCGGCTGGC GCTGACGGCG GTGCACGGCA TGGAAGCCCG CGGCGGCAAA 
TTGGCGCTGG CGACGATGTG CGTCGGCGTC GGCCAGGGCG TCGCGATGGC GATCGAGAAA 
CTGAACTAA

Protein sequence

MADVFICDAV RTPIGRFGGS LAKVRADDLA AVPIKALMAK HPDLDWSAVD EVFFGCANQA 
GEDNRNVARM ATLLAGLPDS VPAQTLNRLC ASGLDAVGAA GRAIRAGEID LAIAGGVESM 
TRAPFVMGKA GEAFSRQADI FDTTIGWRFI NPLMKAQYGV DAMPETGENV AEEFQISRAD 
QDAFAIRSQQ RAGAAIAAGY FAQEIAPVSA PGGKAGPIIV DKDEHPRPET TLEGLAKLKP 
IVRNPGTVTA GNASGVNDGA AAMIVASEAA VKKHGLTPRA KILGLASAAV PPRIMGIGPV 
PATRKLMERL GLKISDFDLI ELNEAFASQG IACLRQLGVA DDADFVNPHG GAIALGHPLG 
MSGTRLALTA VHGMEARGGK LALATMCVGV GQGVAMAIEK LN