Gene RPD_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0040
Symbol
ID	4020494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	50548
End bp	51813
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	64%
IMG OID	637960216
Product	thiolase
Protein accession	YP_567181
Protein GI	91974522
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCTG AAGTCTATGT GATCGGAACT GCCTGTACGC CGTTCGGCAA AAGGCCGCAG 
ACCAGCTTCA AGGCATTGAC CCGCGAGGCG TATCTTGCGG CACTGGCGGA CGCGGGGATG 
GCGGATGGAC GCGACATTGC GATGGCGTGG TTTGGAAACT GCGGCATGGG GACATTCGGA 
CAGCGCAATA TTCGCGGACA GGTCTGCCTC TCTCCGCTGG TGCGGGAGGG GCTGTTTCCC 
GAGCGCATCC CGACGATGAA TGTCGAAGGC GGCTGCGCGA CGGCCTCTCA GGCCCTGCAT 
GGCGCATGGA AGGACATCGC GTCGGGCGAC GCGCAGCTCT CGCTCGCCAT CGGCGTCGAG 
AAGACCTTCG TTCCGGACGA CCCGGCACGA ACGCAGGAGA TCTTCGACGG CGGGATCGAT 
CAGCTCGATC CCGGCGAATG GCTCGCCTAC TACCGCGACG CCGGCGAGGT CAGTGGCAAG 
CCGTTCCAGC CGGATGACAA GCGCGGCACC ATCTTCATGG ATACTTACGC CATGCAGGCG 
GCGTATCACA TGAAACGCTA CGGCACGACG CAGCGCCAGA TCGCGATCGG CGCGGCCAAG 
AACCATCATC ACGGAAGCCT GAATCCGCTG GCGCAATATC GGTTCACAAT GACGGCCGAT 
GAGGTCCTGG CCGATCGCCC GATCAGCTAT CCGCTGACCC GCAGCATGTG TGCGCCGATC 
GGCGACGGCG CCGCCGCCGC CCTGGTCTGC TCGAAGGACT ATCTTGCTTC ATTGCCGCGT 
GGGGTGCGGG AGCGGGCGGT GAAGATCAGG GCGAGCGCGA TGTCGGGCGG CAAGTATCGG 
TCGCTCGACG AGCCTGGGCT TTCGCGCATT GCCGCCGACA GGGCCTACAA AATGGCAGGG 
ATTTCGCCGT CGGACATCGA TATCGCCGAG GTTCATGACG CCACCTCGTT CTGCGAGATC 
TATCAGGTCG AGATGCTGCG CTTCTGCGCA GAAGGACAAG GCGGCGCCTA TGTCGCCTCA 
GGCGCGACCG CGCTCGGCGG CGATCGTCCG GTGAATCTGT CCGGGGGACT GGTCTCCAAG 
GGACATCCGG TCGGAGCCAC AGGTCTTTCG ATGATCCATG AGCTGGTGCT GCAGTTGCGC 
GGCGAGGCCG GCGAACGGCA GGCCAAGAAT GCGCGGCTGG CGCTGGCGGA AAATGGCGGC 
GGCGTCGTCG GCTTCGATGA AGCCGCCTGC GCGATCACGA TCCTGGAGAG GCTCGAGCCC 
AACTGA

Protein sequence

MMPEVYVIGT ACTPFGKRPQ TSFKALTREA YLAALADAGM ADGRDIAMAW FGNCGMGTFG 
QRNIRGQVCL SPLVREGLFP ERIPTMNVEG GCATASQALH GAWKDIASGD AQLSLAIGVE 
KTFVPDDPAR TQEIFDGGID QLDPGEWLAY YRDAGEVSGK PFQPDDKRGT IFMDTYAMQA 
AYHMKRYGTT QRQIAIGAAK NHHHGSLNPL AQYRFTMTAD EVLADRPISY PLTRSMCAPI 
GDGAAAALVC SKDYLASLPR GVRERAVKIR ASAMSGGKYR SLDEPGLSRI AADRAYKMAG 
ISPSDIDIAE VHDATSFCEI YQVEMLRFCA EGQGGAYVAS GATALGGDRP VNLSGGLVSK 
GHPVGATGLS MIHELVLQLR GEAGERQAKN ARLALAENGG GVVGFDEAAC AITILERLEP 
N