Gene RPD_3306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3306
Symbol
ID	4023816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3660855
End bp	3662042
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	68%
IMG OID	637963510
Product	Acetyl-CoA C-acetyltransferase
Protein accession	YP_570431
Protein GI	91977772
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.836004
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGATC CTGTCGTCAT CGTTTCCGCG GCGCGCACGC CGCTCGGCCG GTTCCAGGGC 
GAACTGTCTG CACTCAGCGC TCATCAACTC GGCAGCCAGG TGATCGGCGC AGCGCTGGCG 
CGGGGCAAGC TCGCCCCCGA ACGGATCGAC GAAGTCCTGA TGGGCTGTGT TCTCACCGCC 
GGCCAGGGTC AGGCACCGGC ACGGCAGGCG GCGCGCGGTG CGAAATTGCC GGACGCCACC 
GGCGCCACAA CGGTCAACAA GGTCTGCGGC TCCGGCATGA AAGCGACCAT GCTGGCAAAC 
GACCTGATCC GCGCCGGCTC TGCCGACATC GTGCTGTCGG GCGGCATGGA GAGCATGAGC 
AACGCCCCCT ATCTGCTGGC CAAGGCGCGC AGCGGCTATC GCGTCGGCCA CGACCGGATC 
ATCGACCACA TGCTGATGGA CGGCCTGGAA GACGCCTATG AGAGCGGTCG GTCGATGGGC 
GATTTCGGCG AGGCCACCGC CGAGGCCTAT CAATTCACCC GCGCCGACCA GGACGCCTAT 
GCGATCGAGA CGCTGACCCG CGCCCGCAAT GCGGTTCAGA CCGGCGCGTT CCATGCGGAG 
ATTGTGCCGG TCACCGTGAC CGACAAGGCC GGACCGCGCG AAATCGCCAA TGACGAACAC 
CCGCTGAAGG TCGATCCGGC GAAGATCCCC GCTTTGAAGC CGGCGTTCCG AGCCGGCGGC 
ACGATCACGC CGGCGGCCTC CTCCGCAAAT GCCGACGGCG CCGCGGCGCT GATTCTGGCG 
CGGCGCTCGC TCGCCGAGCG CGACGGCCTG CCGCTACTGG CCGAGATCAA GGGCCATGCC 
ACCCACAGCC AGGAGCCGCA ATGGTTCACC ACCGCGCCGA TCCCGGCGAT CCGTAAACTC 
CTCGACAAGG TCGGCTGGAA CGTCAAGGAC GTCGACCTGT TCGAAATCAA CGAGGCCTTC 
GCGGTGGTGG CAATGGCGGC GCGACAGGAC CTCGATATTC CGCGCGACAG GCTCAACGTC 
AATGGCGGCG CCTGCGCGCT CGGCCACCCG ATCGGCGCCA CCGGCGCGCG GCTGATCGTG 
ACCCTGCTGC ACGCGCTGCA GGCACGCGGC CTGAAACGCG GCGTCGCGGC GCTGTGCATC 
GGCGGCGGTG AAGCCACCGC GATTGCAATC GAGCGCGACG CTCACTAG

Protein sequence

MSDPVVIVSA ARTPLGRFQG ELSALSAHQL GSQVIGAALA RGKLAPERID EVLMGCVLTA 
GQGQAPARQA ARGAKLPDAT GATTVNKVCG SGMKATMLAN DLIRAGSADI VLSGGMESMS 
NAPYLLAKAR SGYRVGHDRI IDHMLMDGLE DAYESGRSMG DFGEATAEAY QFTRADQDAY 
AIETLTRARN AVQTGAFHAE IVPVTVTDKA GPREIANDEH PLKVDPAKIP ALKPAFRAGG 
TITPAASSAN ADGAAALILA RRSLAERDGL PLLAEIKGHA THSQEPQWFT TAPIPAIRKL 
LDKVGWNVKD VDLFEINEAF AVVAMAARQD LDIPRDRLNV NGGACALGHP IGATGARLIV 
TLLHALQARG LKRGVAALCI GGGEATAIAI ERDAH