Gene RPD_3105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3105
Symbol
ID	4023610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3450390
End bp	3451577
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID	637963306
Product	Acetyl-CoA C-acetyltransferase
Protein accession	YP_570232
Protein GI	91977573
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0273238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCACG ATCCCATCGT TATCGTCGGC TCCGCACGCA CGCCGATGGG CGGTTTCCAG 
GGCGAGCTGA AGGACGCCAC TGCGTCCCAG CTCGGCTCCG CCGCCATCGC AGCCGCGGTC 
GCGCGCGCCG GGCTGAAACC GGACGCGATC GACGAGGTGG TGTTCGGCTG CGTGCTGCCG 
GCCGGCCAGG GCCAGGCTCC GGCGCGGCAG GCCGCGCTCG GCGCCGGGCT GCCGCTGTCG 
ACCGGCGCCA CGACCATCAA CAAGATGTGC GGCTCGGGCA TGAAGGCGGC GATGCTGGCC 
AATGATCTTC TGATCGCCGG AAGCGCGACA ATCGCGGTCG CCGGCGGCAT GGAGAGCATG 
ACCAACGCCC CCTATCTGCT CGACCGTGCC CGCGGCGGCT ATCGCATGGG CCACGGCCGT 
GTGCTCGACC ACATGTTCCT CGACGGGCTC GAAGACGCCT ACGACAAGGG CCGGCTGATG 
GGCACCTTCG CCGAGGACTG TGCCCAGAAC TACCAGTTCA CCCGTGAGCT GCAGGACAAT 
TTCGCCATCA CCTCGCTGAC CCGGGCACAG ACCGCGATCA AGGACGGCTC GTTCGCCGGC 
GAGGTAACGC CGGTGACGGT GAAGTCCGGC AGGTCCGAGA TCACCGTGAC TACCGACGAA 
CAGCCGCTGA AAGCGAAACT CGACAAGATC CCGACGCTGA AGCCGGCGTT CCGCGACGGC 
GGCACGGTGA CAGCGGCCAA CTCCTCGTCG ATCTCCGACG GCGCCGCCGC TCTGGTGCTG 
ATGCGTCGCT CGGAGGCCGA ACGGCGCGGG TTGACCCCGC TTGCCGCTAT CGCCGGCCAC 
GCCACCCATG CCCATGAGCC CAATCTGTTT GCCACTGCGC CGATCGGCGC GATACGGAAG 
CTCGCCGAGC GCACCGGTTG GAACCTCGCC GATGTCGACC TGTTCGAAAT CAACGAGGCG 
TTCGCGGTGG TGGCGCTGGC GGCGATGCAC GACCTTGGCC TGCCGCACGA CAAGGTCAAC 
GTCCATGGCG GGGCCTGCGC GCTCGGCCAC CCGATCGGCG CCTCCGGCGC ACGCGTGCTG 
GTGACGCTGC TGGCGGCGCT CGAAAAATAC GACCTCAAGC GCGGCATCGC CTCGTTGTGC 
ATCGGCGGCG GCGAGGCCAC CGCCGTCGCC GTGGAACGGT TGTCCTAA

Protein sequence

MSHDPIVIVG SARTPMGGFQ GELKDATASQ LGSAAIAAAV ARAGLKPDAI DEVVFGCVLP 
AGQGQAPARQ AALGAGLPLS TGATTINKMC GSGMKAAMLA NDLLIAGSAT IAVAGGMESM 
TNAPYLLDRA RGGYRMGHGR VLDHMFLDGL EDAYDKGRLM GTFAEDCAQN YQFTRELQDN 
FAITSLTRAQ TAIKDGSFAG EVTPVTVKSG RSEITVTTDE QPLKAKLDKI PTLKPAFRDG 
GTVTAANSSS ISDGAAALVL MRRSEAERRG LTPLAAIAGH ATHAHEPNLF ATAPIGAIRK 
LAERTGWNLA DVDLFEINEA FAVVALAAMH DLGLPHDKVN VHGGACALGH PIGASGARVL 
VTLLAALEKY DLKRGIASLC IGGGEATAVA VERLS