Gene RPC_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3100
Symbol
ID	3974051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3442733
End bp	3443899
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	67%
IMG OID	637926208
Product	acetyl-CoA acetyltransferase
Protein accession	YP_532961
Protein GI	90424591
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.514057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0765503
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCA GCATCGTCGG GTGGGCGCAC ACGCCGTTCG GCAAGCTCGA AGCCGAGACC 
GTCGAGAGCC TGATCGTGCG GGTGGCGGCC GACGCCTTGG CGGACGCCGG CATCGCCGCC 
GCCGACGTCG ACGAGATCAT CCTCGGGCAT TTCAACGCCG GGTTCTCGCC GCAGGATTTT 
ACCGCCGCCT TGGTGCTGCA GGCCGACCCC GAGCTGCGGT TCAAACCGGC GACCCGGGTT 
GAGAACGCCT GCGCCACCGG ATCGGCCGCG GTGCACCAGG CGGTGAAGTC GGTCGCCGCC 
GGCGCCAAGA TCGTCTTGGT GGTCGGCGTC GAGCAGATGA CCAAGACCCC GGGGCCGGAG 
ATCGGCAAGA ACTTGCTGCG CGCCTCCTAT CTGATCGAGG ACGGCGACAC CCCGGCGGGC 
TTCGCCGGCG TGTTCGGCAA CATCGCGCAG AAGTACTTTC AGAAATACGG CGACCAGTCC 
GACGCGCTGG CGATGATCGC GGCGAAGAAC CACCATAACG GCGTATCGAA TCCCTATGCG 
CAGATGCGCA AGGACATCGG CTTCGACTTC TGCCGCGCTG AGGGCGACAA GAACCCGTTC 
GTCGCCGGCC CCCTGAAACG CACCGACTGC TCGTTGGTGT CGGACGGCGC TGCGGCCTTG 
GTGATCACCG ACGCCGACAC CGCCAAGGCG ATGTCCAAGG CGGTGACGAT CAAAGCCACG 
GCGCACGCTC AGGATTTCCT GCCGATGTCG AAGCGCGACA TTCTGCGGTT CGAGGGCTGC 
AGCGTGGCCT GGCAGCGCGC GCTGCAATCC GCCGGCGCGA CCCTGCAGGA TCTGTCCTTC 
GTCGAGACCC ACGATTGCTT CACCATCGCC GAACTGATCG AATACGAGGC GATGGGCCTG 
ACGCCGGCCG GGCAGGGCGC CCGCGCCATC AAGGAAGGTT GGACCCGCAA GGACGGCAAG 
CTGCCGATCA ATCCGTCCGG TGGCCTCAAG GCCAAAGGCC ATCCGATCGG CGCCACCGGG 
GTGTCGATGC ACGTGCTCTG TGCGATGCAG CTGCTCGGCC AGGCGCCGGA GGGCATGCAG 
ATCAAGGACG CCAAGCTCGC CGGCATTTTC AATATGGGCG GCGCCGCGGT CGCCAACTAC 
GTCTCGCTGC TCGAGCCGGC GCGCTGA

Protein sequence

MTASIVGWAH TPFGKLEAET VESLIVRVAA DALADAGIAA ADVDEIILGH FNAGFSPQDF 
TAALVLQADP ELRFKPATRV ENACATGSAA VHQAVKSVAA GAKIVLVVGV EQMTKTPGPE 
IGKNLLRASY LIEDGDTPAG FAGVFGNIAQ KYFQKYGDQS DALAMIAAKN HHNGVSNPYA 
QMRKDIGFDF CRAEGDKNPF VAGPLKRTDC SLVSDGAAAL VITDADTAKA MSKAVTIKAT 
AHAQDFLPMS KRDILRFEGC SVAWQRALQS AGATLQDLSF VETHDCFTIA ELIEYEAMGL 
TPAGQGARAI KEGWTRKDGK LPINPSGGLK AKGHPIGATG VSMHVLCAMQ LLGQAPEGMQ 
IKDAKLAGIF NMGGAAVANY VSLLEPAR