Gene RPD_4008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4008
Symbol
ID	4024525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4453844
End bp	4455178
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	66%
IMG OID	637964211
Product	phenylacetate--CoA ligase
Protein accession	YP_571128
Protein GI	91978469
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID	[TIGR02155] phenylacetate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCGC AGACCGCTCT CCGCGAAACG CCGATTTATA TGCATGACCG TGCCATCGAG 
ACGATGCCGC GGCCGCAGCT CGCGGCGTTG CAGCTCGAGC GGCTGCGCAG AATCGTCGAG 
CGCGCCTATC GCGACGTCCC GCATTATCGC CGGACGTTCG ACGCCGCCGG CGTCAAGCCG 
TCCGAGCTGA CGTCGCTCGC CGATCTGGCG AAGTTTCCGT TCACCAAGAA GACAGATCTG 
CGCGACAATT ATCCGTTCGA CATGTTCGCG GTGCCGCGCA ATCAGTTGCC GCGAATTCAC 
GCATCATCCG GCACCACCGG AAAGCCGACC GTGGTCGGCT ACACCCGGAA CGATCTCGAT 
AATTGGGCCG ACCTGATGGC GCGGTCGCTG GTCAGCGCCG GCGCCTCGCC GGACGACATC 
GTTCACAACG CCTATGGCTA CGGCCTGTTC ACCGGCGGTC TCGGCGCGCA TTACGGCGCC 
GAGCGGCTCG GCTGCACAGT GGTGCCGATC TCCGGCGGCG GCACCGAGCG TCAGGTCACG 
CTGATGATGG ACTTCGGCGC CGACGTGCTG TGCAGCACGC CGTCCTACGC ACTCAACATC 
GCCGAAGTCG CCGAGCAGAT GGGCGTCGAT CTGCGCAAGG CGCCGCTGCG CGTCGGGCTG 
TTCGGCGCCG AGCCGTGGAG CGACGCGATG CGGCGCGACC TCGAGGCGCG GCTCGGCATC 
AAGGCGATCG ACATCTACGG CCTGTCGGAG ATCATGGGCC CTGGCGTCGC CTGCGAATGC 
CACGTCGCGC AGAATGGCCT GCACGGCTGG GAGGATCACT TCCTGTTCGA GACCATCGAT 
CCGGAAACGC TGCAGCCGTT GCCGCTCGGC TCGACCGGCG AACTGGTGAT CACCACGCTC 
ACCAAGGAAG CGCTGCCGAT GATCCGGTAT CGCACCCGCG ACATCACCAG CCTCTCGACC 
GAGCCCTGCG CCTGCGGTCG CACCCATCTG CGGATCATGC GCGTCACCGG CCGCGACGAC 
GACATGCTGA TCATCCGCGG CGTCAACGTC TATCCGTCGC AGGTGGAGTC GGTGCTGGTC 
GGCTTCCCCG GCATCGCGCC GCACTACCAG ATCGTGCTGA CCCGCGACAA AGCGCTCGAC 
GCCATGACCG TCGAAGTCGA GATCGCCCCG GATGCGCCGC GCGACGACGC CTCGCTGGCG 
TACAAGGCCG CCGAGGTCAC GCATCACATC AAGTCGCTGA TCGGCGTCAC CTGCAAGGTC 
ACCGTCAAGG CGCCCGGCGA AGTGCCGCGC TCGCAGGGCA AGGCGGTGCG GGTGAAGGAT 
CAGCGGAATA TTTGA

Protein sequence

MGAQTALRET PIYMHDRAIE TMPRPQLAAL QLERLRRIVE RAYRDVPHYR RTFDAAGVKP 
SELTSLADLA KFPFTKKTDL RDNYPFDMFA VPRNQLPRIH ASSGTTGKPT VVGYTRNDLD 
NWADLMARSL VSAGASPDDI VHNAYGYGLF TGGLGAHYGA ERLGCTVVPI SGGGTERQVT 
LMMDFGADVL CSTPSYALNI AEVAEQMGVD LRKAPLRVGL FGAEPWSDAM RRDLEARLGI 
KAIDIYGLSE IMGPGVACEC HVAQNGLHGW EDHFLFETID PETLQPLPLG STGELVITTL 
TKEALPMIRY RTRDITSLST EPCACGRTHL RIMRVTGRDD DMLIIRGVNV YPSQVESVLV 
GFPGIAPHYQ IVLTRDKALD AMTVEVEIAP DAPRDDASLA YKAAEVTHHI KSLIGVTCKV 
TVKAPGEVPR SQGKAVRVKD QRNI