Gene RPD_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1103
Symbol
ID	4021579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1252825
End bp	1254717
Gene Length	1893 bp
Protein Length	630 aa
Translation table	11
GC content	66%
IMG OID	637961295
Product	long-chain-acyl-CoA synthetase
Protein accession	YP_568242
Protein GI	91975583
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCAA TCGTCAGTCG CATTCGAGTA AGTTGCACCG ACAATTCTCA CGATCTTGTC 
GGGCTGGCGT TCATGAACAT CCAAGCAAGA CCTGCGACGG ACGACGCGCT GCAGACGCGT 
CGCGCGCAAC CATCGGTGGC CAAAAGCTGG TTGAAGGCGA TCGAGATCAC GGCGCGGGTC 
GAGCAGGAGC CGCGACGACT GCTCGCAACC GTCGTCGACG AATGGGCAGC CGTCGCACCG 
AACTCCCCCG CGATCGTGTC GGATCGCGAC TCCTACAGCT ACGCGGAGCT CGCGCGCCGC 
ATCAACCGCT ATGCGCGCTG GGCGCTGGAG AACGGGGTCG GCATCGGCGA CGTCGTCTGC 
CTGCTGATGT CGAACCGGCC GGACTACGTC GCAGCCTGGC TCGGCATCAC CAAGGTCGGC 
GGCGTGGTCG CGCTGATCAA CACCCAGCTC GTCGGCGCAT CCCTGGCGCA TTGCATCGAC 
ATCGCGCAGC CCGGACACAT CATCGTCGGC GAGGAATTCG TCGACGCGTG GGAGAGCGCC 
CGCGCGCATC TCGGAGCGGC TCCGCGAATC TGGCTCCATG GCGAGACTTC TGGAGACAAG 
GCGCTGGACC AGGCGCTCGC GGCGCTCGAC AGCGCTGCGC TGGCGCCGCA GGAGCAGCGC 
GACGTCGGCA TCGATGATCT GGCGCTGCTG ATCTACACAT CCGGAACCAC CGGCCTGCCC 
AAGGCGGCGC GCGTCACCCA TCGCCGGGTG ATGGGCTGGG CCGGCTGGTT CGCGGGGTTG 
ACCGACGCCG CACCGGACGA TCGGATGTAC AACTGCCTGC CGATCTATCA CAGCGTCGGC 
GGCGTGGTCG CGACCGGCAG CATGCTGATG GCGGGCGGCT CGGTGGTGAT CGCCGAGAAA 
TTCTCCGCGA GCCGGTTCTG GGACGACATC ATCCGCTGGG ACTGCACGCT GTTTCAATAT 
ATCGGCGAAC TCTGCCGCTA TCTGCTGCAG GCGCCGCCAT CCGACCGCGA CACCCGGCAT 
CGGCTGCGGC TGTGCTGCGG CAATGGATTG CGCGGCGAGA TCTGGGAGCC GTTCCAGGCG 
CGCTTTGCGA TCCCCCGCAT CCTCGAATTC TACGCGTCGA CCGAGGGCAA TTTCTCGCTC 
TACAATGTCG AGGGCAAGCC CGGCGCGATC GGGCGCATTC CGTCATTTCT GGCGCATCGC 
TTTCCCGCGG CGATCGTCAA ATTCGACGTC GAGACCGGCG GTCCGCTGCG CGACGAGAAC 
GGGCTGTGCA TCCGTTGCGC CCGCGGCGAA ACCGGAGAAG CGATCGGCCG GATCGGCGAG 
GCGCGCGACA GCGGCGGCCG GTTCGAAGGC TACACCAACG ATTCCGAAAC CGAGAAGAAG 
GTGCTGCGCG ACGTGTTCGC CGCAGGCGAC GCGTGGTTTC GCACCGGCGA CCTGATGAGG 
CTCGACGACA AGGGCTTCTT CCATTTCGTC GACCGGATCG GCGACACCTT CCGCTGGAAG 
GGCGAGAACG TCGCGGCGAG CGAGGTCGCC GAAACGATCG CCGCCTGCCC CGGCGTGATC 
GACGCCAGCG TCTATGGCGT GTCGGTGCCC CACACGGACG GCCGCGCCGG CATGGCGGCG 
CTGGTCGTCG ACGATCGCTT CGACCTCGCG GCGCTGCATC GCCATCTCGC CGAACGGTTG 
CCGGCCTATG CGCGCCCGGT CTTCATCCGG ATCCAGGCCG CACTGCAGAT CACCGGCACC 
TTCAAGCAGA ACAAGCAGGA TTTGATCCGC GACGGCTTCG ATCCCGTCGT TGTGAGCGAT 
CCGCTGTATC TCGGCGATGC GACCGCAGCC GGCTACGTCG TGCTCGATGA GCCTCTGCAT 
CGCAGGATTG CGGCCGGCAC ACTGCGGCTT TGA

Protein sequence

MQSIVSRIRV SCTDNSHDLV GLAFMNIQAR PATDDALQTR RAQPSVAKSW LKAIEITARV 
EQEPRRLLAT VVDEWAAVAP NSPAIVSDRD SYSYAELARR INRYARWALE NGVGIGDVVC 
LLMSNRPDYV AAWLGITKVG GVVALINTQL VGASLAHCID IAQPGHIIVG EEFVDAWESA 
RAHLGAAPRI WLHGETSGDK ALDQALAALD SAALAPQEQR DVGIDDLALL IYTSGTTGLP 
KAARVTHRRV MGWAGWFAGL TDAAPDDRMY NCLPIYHSVG GVVATGSMLM AGGSVVIAEK 
FSASRFWDDI IRWDCTLFQY IGELCRYLLQ APPSDRDTRH RLRLCCGNGL RGEIWEPFQA 
RFAIPRILEF YASTEGNFSL YNVEGKPGAI GRIPSFLAHR FPAAIVKFDV ETGGPLRDEN 
GLCIRCARGE TGEAIGRIGE ARDSGGRFEG YTNDSETEKK VLRDVFAAGD AWFRTGDLMR 
LDDKGFFHFV DRIGDTFRWK GENVAASEVA ETIAACPGVI DASVYGVSVP HTDGRAGMAA 
LVVDDRFDLA ALHRHLAERL PAYARPVFIR IQAALQITGT FKQNKQDLIR DGFDPVVVSD 
PLYLGDATAA GYVVLDEPLH RRIAAGTLRL