Gene Rpal_3956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3956
Symbol
ID	6411637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4245178
End bp	4246347
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	66%
IMG OID	642713837
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001992927
Protein GI	192292322
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.358639
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCCA GCATCGTTGG ATGGGCCCAT ATGCCGTTCG GCAAGTTCGA CGCCGAAACC 
GTGGAAAGCA TGATCGTCCG TGTCGCCACC GAGGCGATCG CCGACGCCGG GATCGCGGCC 
TCGGATGTCG ACGAAATCGT GCTCGGGCAT TTCAATGCCG GATTCTCGCC GCAGGACTTC 
ACAGCCGCGC TGGTGCTGCA GGCCGATCCG GCGCTCCGCT TCAAGCCGGC GACGCGCGTC 
GAGAACGCCT GCGCGACCGG CTCGGCCGCC GTGCATCAGG GCATCCGCGC GATCGAAGCC 
GGTGCCGCCA AGATCGTGCT GGTGGTCGGC GTCGAGCAGA TGACCCGCAC GCCCGGGCCG 
GAGATCGGCA AGAACCTGCT GCGCGCCTCT TACTTGCCGG AGGACGGCGA CACGCCCGCC 
GGGTTCGCTG GTGCGTTCGG CATCATCGCT CAGAAGTACT TCCAGAAATA TGGCGACCAG 
TCCGATGCGC TGGCGATGAT CGCCGCCAAG AACCACCACA ACGGCGTTGC CAATCCCTAT 
GCGCAGATGC GCAAGGATTT CGGCTTCGAG TTCTGCCGCG CCGAAGGCGA GAAGAATCCA 
TTCGTCGCCG GGCCCTTGAA GCGCACCGAT TGCTCGCTGG TCTCGGACGG CGCCGCGGCG 
CTGGTGCTGA CCTCGGCCGA GAACGCCAAG GCGATGGGCA AGGCGGTCAA CATCCGCGCC 
CGCGCCCATG CGCAGGACTT TCTGCCGATG TCCAAGCGCG ACATCCTGCA GTTCGAAGGC 
TGCACCGTCG CCTGGCAGCG CGCGCTGGAG CAGGCCGGCG TCACGCTGAA CGATCTGTCG 
TTCGTCGAGA CCCACGATTG CTTCACCATC GCCGAGCTGA TCGAATACGA AGCGATGGGC 
CTGACGCCGA AGGGGCAGGG CGCCCGCGCC ATCAAGGAGG GCTGGACCCA GAAGGACGGC 
AAGCTGCCGA TCAATCCGTC CGGCGGTCTC AAGGCCAAGG GCCATCCGAT CGGCGCCACC 
GGCGTGTCGA TGCACGTGCT GAGCGCGATG CAGCTGCTTG GCCAGGCGCC GGAAGGCATG 
CAGATCAAGG ACGCCAAGCT CGCCGGCATC TTCAACATGG GCGGCGCCGC GGTCGCCAAC 
TACGTGTCGG TGCTCGAACC GGCCAAGTAA

Protein sequence

MTASIVGWAH MPFGKFDAET VESMIVRVAT EAIADAGIAA SDVDEIVLGH FNAGFSPQDF 
TAALVLQADP ALRFKPATRV ENACATGSAA VHQGIRAIEA GAAKIVLVVG VEQMTRTPGP 
EIGKNLLRAS YLPEDGDTPA GFAGAFGIIA QKYFQKYGDQ SDALAMIAAK NHHNGVANPY 
AQMRKDFGFE FCRAEGEKNP FVAGPLKRTD CSLVSDGAAA LVLTSAENAK AMGKAVNIRA 
RAHAQDFLPM SKRDILQFEG CTVAWQRALE QAGVTLNDLS FVETHDCFTI AELIEYEAMG 
LTPKGQGARA IKEGWTQKDG KLPINPSGGL KAKGHPIGAT GVSMHVLSAM QLLGQAPEGM 
QIKDAKLAGI FNMGGAAVAN YVSVLEPAK