Gene Rpal_5047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5047
Symbol
ID	6412741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5429113
End bp	5430528
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	67%
IMG OID	642714932
Product	bifunctional enoyl-CoA hydratase/phosphate acetyltransferase
Protein accession	YP_001994011
Protein GI	192293406
COG category	[C] Energy production and conversion [I] Lipid transport and metabolism
COG ID	[COG0280] Phosphotransacetylase [COG2030] Acyl dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCAGA TCCAAAACCG CACCTTTGAT GAGATTGAGG TCGGTGACAC CGCCAGTCTG 
GTTCGCACGC TGACCTATCG CGACATCGAG GTGTTCGCGG TGATGTCCGG CGACGTCAAC 
CCGATGCATG TCGACGCGGC GTTCGCCAAG AGCGACATGT TCCATCAGGT GGTGGCGCAC 
GGCATGTGGG GCGGGGCGCT GATCTCGACT CTACTCGGCA CGCAATTGCC CGGGCCCGGC 
ACGATCTATC TCGATCAATC GCTGCGGTTC GCAAGGCCCG TGCTGCTCGG CGACACCGTG 
ACCGTCACGG TCACGGTCAA AGAGAAGAAC GCGGCCAAGA AACGCCTGCT GCTGGATTGC 
CGCGCTACCA ATCAGCGCGG CGAGGAGGTA ATCACCGGCC TCGCCGAAGT GATCGCGCCG 
GTCGAGAAGA TCTCGCGGCC GCGGGTGCTG CTGCCGGAAA TCGATCTCAA TCGCACCGCG 
CAGCGCTACG AGCGGCTGAT CGAAATGACG CGCGGGCTGC AGCCGATCCG CACCGCGGTG 
GTGCACCCGG TGGATTCCGC CTCGTTGCTC GGCGCTGTCG AGGCGGCGCG CGAGGGGCTG 
ATCGTGCCGG TCCTGGTCGG ACCGGAAGCC AAGATCCGCG CCGCCGCCGC CCAGGCCGCG 
GTGGATCTTG CCGGCTACGA GATCGTTGCG GTCGAGCACA GCGCGGCCGC TGCCGAAGCC 
GGGGTGGCGA TGGCGCGGGC CGGCGAGGTC GAGGCGGTGA TGAAAGGCGC GCTGCACACC 
GACGAGCTGA TGCACGCGGT GGTCGATCGT ACCCGCGGTC TCCGTACCGC ACGTCGTATC 
AGCCACGTCT ATGCGATTGA CGCACCGGAC TATCCCCGCG CGCTGCTGGT CACTGACGCG 
GCGATCAACA TCTACCCGAC GCTCGCTGAC AAGCGCGACA TCATCCAAAA CGCGATCGAT 
CTGGCGCATG CGCTGGGGAT CGCCGAGCCG CGGGTGGCGA TCCTGTCGGC GGTCGAAACC 
GTCACCGAGA GCATCCGCTC GACGCTCGAT GCAGCCGCAT TGTGCAAGAT GGCCGAGCGC 
GGCCAGATCA AAGGTGGCAT CCTCGACGGG CCGCTGGCCT TCGACAACGC GGTGTCGGAA 
GAGGCTGCCA AGACCAAGGG TATCGTTTCG CAGGTGGCGG GGCGTGCCGA CATCTTCGTG 
GTGCCGGACC TCGAGGCCGG CAACATGCTG GCCAAGCAAC TCGAATATCT GGCGCACGCC 
CGCGTCGCCG GGATCGTGCT CGGCGCGCGG GTGCCGATCA TCCTCACCAG CCGCGCCGAC 
AAGACGCTGG CGCGGCTCGG GTCTTGCGCG ATCGCGCTGC TGCTCGCTCG CCACAACACC 
GCGGCGCCGC CGCGCGTTTC CGGAGGTGCC GCATGA

Protein sequence

MEQIQNRTFD EIEVGDTASL VRTLTYRDIE VFAVMSGDVN PMHVDAAFAK SDMFHQVVAH 
GMWGGALIST LLGTQLPGPG TIYLDQSLRF ARPVLLGDTV TVTVTVKEKN AAKKRLLLDC 
RATNQRGEEV ITGLAEVIAP VEKISRPRVL LPEIDLNRTA QRYERLIEMT RGLQPIRTAV 
VHPVDSASLL GAVEAAREGL IVPVLVGPEA KIRAAAAQAA VDLAGYEIVA VEHSAAAAEA 
GVAMARAGEV EAVMKGALHT DELMHAVVDR TRGLRTARRI SHVYAIDAPD YPRALLVTDA 
AINIYPTLAD KRDIIQNAID LAHALGIAEP RVAILSAVET VTESIRSTLD AAALCKMAER 
GQIKGGILDG PLAFDNAVSE EAAKTKGIVS QVAGRADIFV VPDLEAGNML AKQLEYLAHA 
RVAGIVLGAR VPIILTSRAD KTLARLGSCA IALLLARHNT AAPPRVSGGA A