Gene RPD_3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3551
Symbol
ID	4024065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3947606
End bp	3948793
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	68%
IMG OID	637963755
Product	Acetyl-CoA C-acyltransferase
Protein accession	YP_570675
Protein GI	91978016
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CCGTTATTGT TTCCACCGCG CGCACGCCGA TCGGCAAGGC CTATCGCGGC 
GCGCTCAACG CCACCGAAGG TGCAACGCTG CTCGGCCATG CGATCGGCGA AGCGGTCAAG 
CGCGCCAATC TCGATCCCAA GGAGATCGAG GACGTGGTGA TGGGCTCTGC GATGCAGCAG 
GGCTCCACCG GCGGCAACAT CGCCCGCAAG GCGCTGCTGC GCGCCGGCCT GCCGGTGACC 
ACCGCCGGCA CCACGATCGA TCGGCAGTGC GCGTCCGGCC TGCAGGCGAT CGCGCTCGCG 
GCGCGCTCGG TGATCTTCGA CGGCGTCGAG ATCGCAGTCG GCGGTGGCGG CGAGTCGATC 
AGCCTGGTGC AGAACGACAA GATGAACACC TTCCACGCCG TCGATCCCGA ATTGCAGGCG 
ATCAAGGGCG ACGTCTACAT GGCGATGATC GACACCGCCG AAATCGTCGC GAAGCGCTAC 
GGCATCTCCC GCGAGGCGCA GGACGTCTAC GCGCTGGAGA GCCAGCGCCG CACCGCGGCG 
GCGCAGCAGG GCGGCAAGTT CAAGGACGAG ATCGCGCCGA TCGCGACCCG GATGGGCGTC 
GTCGACAAGG CCACCGGCGC GGTGTCGATG AAGGACGTGA CGCTGTCGCA GGATGAAGGT 
CCGCGTCCGG AGACCACCGC CGAAGGCCTC GCAGGCCTGA AGCCGGTCCG TGGCGAGGGC 
TTCGCCATCA CCGCAGGTAA CGCCAGCCAG TTGTCGGACG GCGCCTCCGC CACCGTGGTG 
ATGAGCGACA AGCTCGCGGC GCAGAAGGGC CTCAAGCCGC TCGGCATCTT CCGCGGCTTC 
GTCTCGGCCG GCTGCGAGCC GGACGAGATG GGCATCGGCC CGGTGTTCGC GGTGCCGCGG 
CTGTTGAAGC GCCACGGTCT CAAGGTCGAG GACATCGACC TTTGGGAGCT GAACGAGGCG 
TTCGCCGTGC AGGTGCTGTA TTGCCGCGAC AAGCTCGGCA TCGATCCGGA GAAGCTCAAC 
GTCAATGGCG GCGCGATCTC GGTCGGCCAT CCTTACGGCA TGTCGGGCGC GCGCCTGACC 
GGCCACGCGC TGATCGAAGG CCGCCGCCGC AAGGCGAAGT ACGCGGTGGT AACGATGTGC 
GTCGGCGGCG GCATGGGCTC GGCGGGTCTG TTCGAGATCG TGCACTGA

Protein sequence

MTDAVIVSTA RTPIGKAYRG ALNATEGATL LGHAIGEAVK RANLDPKEIE DVVMGSAMQQ 
GSTGGNIARK ALLRAGLPVT TAGTTIDRQC ASGLQAIALA ARSVIFDGVE IAVGGGGESI 
SLVQNDKMNT FHAVDPELQA IKGDVYMAMI DTAEIVAKRY GISREAQDVY ALESQRRTAA 
AQQGGKFKDE IAPIATRMGV VDKATGAVSM KDVTLSQDEG PRPETTAEGL AGLKPVRGEG 
FAITAGNASQ LSDGASATVV MSDKLAAQKG LKPLGIFRGF VSAGCEPDEM GIGPVFAVPR 
LLKRHGLKVE DIDLWELNEA FAVQVLYCRD KLGIDPEKLN VNGGAISVGH PYGMSGARLT 
GHALIEGRRR KAKYAVVTMC VGGGMGSAGL FEIVH