Gene RPC_1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1854
Symbol
ID	3971868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	2017521
End bp	2018801
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	63%
IMG OID	637924967
Product	formyl-coenzyme A transferase
Protein accession	YP_531732
Protein GI	90423362
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID	[TIGR03253] formyl-CoA transferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.780367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGG CGCTGAACGG CGTTCGCATT CTGGACTTCA CCCACGTCCA GTCCGGCCCG 
ACCTGCACGC AACTGCTGGC CTGGTTCGGC GCCGACGTGA TCAAGGTCGA GCGCCCCGGT 
GTCGGCGACA TTACGCGGGG GCAATTGCAA GACATCCCGA ACGTCGACAG CCTGTATTTC 
ACCATGCTGA ACCACAACAA GCGCTCGATC ACGCTCGACA CCAAGAACCC CAAGGGCAAG 
GAAGTGCTCA CCGCGCTGAT CAAGAGCTGC GACGTGCTGG TGGAGAATTT CGGCCCCGGC 
GTGCTCGACC GCATGGGATT TTCCTGGGAG AAGATCCAGA GCCTCAATCC GAAGATGATC 
GTCGCCTCGA TCAAGGGATT CGGCCCCGGC CCCTATGAGG ATTGCAAGGT CTACGAGAAC 
GTCGCGCAAT GCACCGGCGG CGCGGCGTCG ACCACCGGCT TCCGCGACGG CCTACCGCTG 
GTCACCGGCG CGCAGATCGG CGATAGCGGC ACCGGCCTGC ATCTCGCGCT CGGCATCGTC 
ACCGCCTTGT ATCAACGCAC GGTGACCGGC CGCGGCCAGA AGGTGACCGC GGCGATGCAG 
GACGGCGTGT TGAATTTGTC GCGGGTGAAA TTGCGCGACC AGCAGCGCCT CGCCCATGGC 
CCGCTGAAGG AATACAGCCA GTTCGGCGAA GGCATTCCGT TTGGAGATGC CGTTCCTCGC 
GCGGGAAACG ATTCCGGCGG CGGCCAGCCG GGACGGATTC TGAAGTGCAA GGGCTGGGAG 
ACCGATCCCA ACGCCTACAT CTACTTCATT ACGCAAGCGC CGGTGTGGGA GAAGATTTGC 
GACGTGATCG GCGAGCCGGA TTGGAAAACC CATCCCGACT ACGCCAAGCC GGCGGCGCGG 
CTCAAGCACC TCAACGACAT CTTCGCGCGC ATCGAACAAT GGACCATGAC CAAGACCAAG 
TTCGAGGCGA TGGACATTCT CAACAAGGAC GACATTCCCT GCGGGCCGAT CCTGTCGATG 
AAGGAACTCG CCGAGGATCA ATCGCTGCGC GCCACCGGCA CGGTGGTCGA GGTCGATCAT 
CCGACCCGCG GCAAGTATCT GTCGGTCGGC AACCCGATCA AGATGTCGGA TAGCCCGACC 
GAGGTGATGC GCTCGCCCTT GCTCGGCGAG CACACCGACG AGATCCTGCG GCAGGTGCTC 
GGCTTCAGCG ATCAGCAGGT CGCCGAGGTG CATGATTCCG GCGCGCTGGA ACCACCGCGC 
AAGGCGGCTG CGGCGGAATA A

Protein sequence

MTKALNGVRI LDFTHVQSGP TCTQLLAWFG ADVIKVERPG VGDITRGQLQ DIPNVDSLYF 
TMLNHNKRSI TLDTKNPKGK EVLTALIKSC DVLVENFGPG VLDRMGFSWE KIQSLNPKMI 
VASIKGFGPG PYEDCKVYEN VAQCTGGAAS TTGFRDGLPL VTGAQIGDSG TGLHLALGIV 
TALYQRTVTG RGQKVTAAMQ DGVLNLSRVK LRDQQRLAHG PLKEYSQFGE GIPFGDAVPR 
AGNDSGGGQP GRILKCKGWE TDPNAYIYFI TQAPVWEKIC DVIGEPDWKT HPDYAKPAAR 
LKHLNDIFAR IEQWTMTKTK FEAMDILNKD DIPCGPILSM KELAEDQSLR ATGTVVEVDH 
PTRGKYLSVG NPIKMSDSPT EVMRSPLLGE HTDEILRQVL GFSDQQVAEV HDSGALEPPR 
KAAAAE