Gene Rpal_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4236
Symbol
ID	6411920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4547984
End bp	4549171
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	69%
IMG OID	642714118
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001993207
Protein GI	192292602
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGG CCGTTATCGT TTCAACCGCG CGCACGCCGA TCGGCAAGGC GTATCGCGGC 
GCCCTCAACG CCACCGAGGG CGCCACGCTG CTCGGCCACG CCATCGAGCA CGCGGTGAAG 
CGCGCCGGAA TCGACCCGAA GGAGGTCGAG GACGTGGTGA TGGGCGCGGC GATGCAGCAG 
GGCGCCACCG GCGGCAACAT CGCCCGCAAG GCGCTGCTGC GCGCCGGCCT GCCGGTGACC 
ACCGCCGGCA CCACCATCGA CCGGCAGTGC GCGTCCGGCC TGCAGGCGAT CGCGCTCGCT 
GCCCGCTCGG TGCTGTTCGA CGGCGTCGAG ATCGCGGTCG GCGGCGGCGG CGAGTCGATC 
TCGCTGGTGC AGAACGACAA GATGAACACC TTCCACGCCG TCGATCCGGC GCTCGAGGCG 
ATCAAGGGTG ACGTCTACAT GGCGATGCTC GACACCGCCG AAACCGTGGC GAAGCGCTAC 
GGCATCTCGC GCGAGCGCCA GGACGAGTAT TCGCTGGAAA GCCAGCGCCG CACCGCAGCG 
GCGCAGCAGG GCGGCAAGTT CAACGACGAG ATCGCGCCGA TCTCCACCAA GATGGGCGTC 
GTCGACAAGG CCACCGGCGC AGTGTCGTTC AAGGACATCA CGCTGTCGCA GGACGAAGGC 
CCGCGGCCGG AGACGACCGC CGAAGGTCTC GCCGGTCTTA AGGCCGTGCG TGGTGAAGGC 
TTCACCATCA CTGCCGGCAA TGCCAGCCAG CTGTCGGACG GCGCGTCGGC CACGGTGATC 
ATGAGCGACA AGACGGCGGC CGCGAAGGGC CTCAAGCCGC TCGGCATCTT CCGCGGCATG 
GTCTCCTACG GCTGCGAGCC GGACGAGATG GGCATCGGCC CGGTGTTCGC GGTGCCGCGC 
CTGCTCAAGC GCCACGGCCT GACCGTCGAC GACATCGGCG TTTGGGAGCT GAACGAGGCA 
TTCGCCGTGC AGGTGCTGTA CTGCCGCGAT AAGCTCGGCA TCGATCCGGA GAAGCTCAAC 
GTCAACGGCG GCGCGATCTC GGTCGGCCAC CCCTACGGCA TGTCGGGCGC CCGCCTGACC 
GGCCACGCGC TGATTGAAGG CCGCCGCCGC AAGGCGAAGT ACGCGGTGGT CACGATGTGC 
GTTGGCGGCG GCATGGGCTC CGCCGGCCTG TTCGAGATCG TGCACTGA

Protein sequence

MTEAVIVSTA RTPIGKAYRG ALNATEGATL LGHAIEHAVK RAGIDPKEVE DVVMGAAMQQ 
GATGGNIARK ALLRAGLPVT TAGTTIDRQC ASGLQAIALA ARSVLFDGVE IAVGGGGESI 
SLVQNDKMNT FHAVDPALEA IKGDVYMAML DTAETVAKRY GISRERQDEY SLESQRRTAA 
AQQGGKFNDE IAPISTKMGV VDKATGAVSF KDITLSQDEG PRPETTAEGL AGLKAVRGEG 
FTITAGNASQ LSDGASATVI MSDKTAAAKG LKPLGIFRGM VSYGCEPDEM GIGPVFAVPR 
LLKRHGLTVD DIGVWELNEA FAVQVLYCRD KLGIDPEKLN VNGGAISVGH PYGMSGARLT 
GHALIEGRRR KAKYAVVTMC VGGGMGSAGL FEIVH