Gene RPD_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1031
Symbol
ID	4021507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1180230
End bp	1182329
Gene Length	2100 bp
Protein Length	699 aa
Translation table	11
GC content	69%
IMG OID	637961223
Product	CoA-binding
Protein accession	YP_568170
Protein GI	91975511
COG category	[C] Energy production and conversion
COG ID	[COG1042] Acyl-CoA synthetase (NDP forming)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.143696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAGGGG TTGGCGTGTC GGCGATGACT GATTTCGATA TCCATGCCCT GATCGAGCCG 
AAATCGATCG CAATGGTCGG CGTGTCTCCC GGTGCGCCGA ATTCATGGGG GTTCCGCACC 
ATGCGGGTGC TGGCCGAGGG CGGCTATACT GGCGCGCTTT ACGCCGTGCA TCCGACCAAA 
ACCGTTCCCG GTTTCGAGAC CGTTCGCTCG CTTCGCGACA AGCCGGCGCC CGATCTGGTC 
GCGGTCTGCG TGCGCGCCGA GCAGGCCGTC GATGTGGTCC GCGAGGCGCG GGAGATCGGC 
GCCAAGGCCG CGATCGTTTT CGCGTCGAAT TTTGCCGAAA TCGGCGAGGA TGGCGTCCGC 
CTGCAGCGTG AGCTGATCGA GGCCGCCGGC GATATGCCGT TTCTCGGGCC GAATTGTCTC 
GGCTTTTCCA ATCGCACCGC GTCGGTGAAG ATGTCGGTGG CGCCGTTCCT CAATCGGCCG 
TTGCTGCCGC CCGGTCCCGT TGCGCTGGTG GCGCAATCCG GCGCGCTCGG CCTCGTCCTT 
GCGCAATGCG TGGAGGAGAG CGGCGTCGGC TACTCGCACT TCATCAGCGT CGGCAATGAA 
TGCGTGGTGA CGGCGTCGAT GCTGGCGCGG CAGCTCGTCG AGCGCGACGA TGTCGGGATC 
GTTTTCATCT ATCTCGAGAC GCTGCGCGAC CCGCAGGTGC TGGCGGAAGC CGCCGCGCGC 
GCCCACGCGC TCGGCAAGCG GATCATCGTG TTGAAGGCCG GCGCCTCCGA CGCGGGCCGG 
CGCGCGGCGC TGTCGCACAC CGCGGCGATT GCGGGCAACG ACACGCTGTT CGGGGCGCTT 
GCGCGCGACC TGGGCATCGT CAGCATTCGC GACGACGAAG GCGTTCAGCC CGTGCTGGCC 
GCGCTCCGGC GCGACTGGGT CATGCCGCCG AAGCCGCGGG TGGCGATCCT CAGCAATTCG 
GGCGGCGCGG GCGCGCTGCT GGCCGACCGG CTGGTGGCGG AAGGTGCGCG CGTCGAGGCG 
TTTTCCGAGC CGTTGCGGCA GGCGATCCGC CAGACCGGGC TGGTCGAGGC CGGCGATCAA 
AATCCGCTCG ACATCGGCGG TGGTTGGGAA GCGTTGCTGG ATCGCGTCGA GCCGTGTCTC 
GAAGTTCTCG ACCACGCCGA AGAGGTCGAC GCCGTCGTCG TCTACTATGC GTTCGGCGAC 
ATCATCGGCG CGAAGGTCGC GCCGATCGCC GACTATTGCG CGGCGATGTC GAAGCCGGCG 
GTGTTCGTCT GGCAGGCTGC GCCGTCGGAA TTCTATGCGA GCGTTACGGC GCGCGACGTT 
CTCACCGCGA CGATCGGCGG CGGGGTGCGC GCGGTCGTCG CGCAGATGGC TCTCGCCTCC 
GCCGGCGAGG TCGCGTGGCA GCGCCGCGAT GTCGCCGCGG TGGCGTTGCC GGTGGTCCAA 
GCGGGCCAGT CCACCATCGC CGAACTCGAC GCGGGCGCCG TCCTGCGAAA GCTTGGGATC 
GGCGTCGTCG ATGCGGTCGT GTCCGCGCGC GGACAGGCTG CCGCGGCAAT CGCCGAAGTC 
GGCGCCAAGG GATGGACGCG CTGCGTCGTC AAGGGCAACG CCGCCGACGT CCTGCATCGC 
AACCGTGTCG GCCTGGTCGA AGTCGGCGTG CCGGTCGAAC GGCTCGCCGA AGTCCTGGAG 
CGTTTCGAGC GGCGGCTGGA CGAGGTGTCG TCCGATCCGC AGCGCAGTCT GCTGATTCAG 
CCGATGATCG CCTTCGAGGA CGAAATCGGC GTCGGCGCTC TGCTCGATCC GAATTACGGC 
CCCGCGATCC TGATCGGGCC GGGCGGCGTC GGCATCGAGG CGGCTTCGGG CGAGCGGCAC 
GTCCTGCTGC TGAGCGCGTC CGATGAAGCG CGCGCGGCTT ACCAGAGCCG TGTCGAAGAC 
GCTTACGGCC TCGCGCCCGG AACGCTCGAG CCGGTCGTCG CCGGACTCGA GCGGCTGCTC 
GCGACGCCGA CTATTTCCGA GATCGATATC AATCCGATGG TGCGAACGCC CGACGGCGGT 
CTCATCGCGC TGGATGCTCT CATCGTCGTC GAACCGCATC ACCCGACGGC CGCCGCCTGA

Protein sequence

MRGVGVSAMT DFDIHALIEP KSIAMVGVSP GAPNSWGFRT MRVLAEGGYT GALYAVHPTK 
TVPGFETVRS LRDKPAPDLV AVCVRAEQAV DVVREAREIG AKAAIVFASN FAEIGEDGVR 
LQRELIEAAG DMPFLGPNCL GFSNRTASVK MSVAPFLNRP LLPPGPVALV AQSGALGLVL 
AQCVEESGVG YSHFISVGNE CVVTASMLAR QLVERDDVGI VFIYLETLRD PQVLAEAAAR 
AHALGKRIIV LKAGASDAGR RAALSHTAAI AGNDTLFGAL ARDLGIVSIR DDEGVQPVLA 
ALRRDWVMPP KPRVAILSNS GGAGALLADR LVAEGARVEA FSEPLRQAIR QTGLVEAGDQ 
NPLDIGGGWE ALLDRVEPCL EVLDHAEEVD AVVVYYAFGD IIGAKVAPIA DYCAAMSKPA 
VFVWQAAPSE FYASVTARDV LTATIGGGVR AVVAQMALAS AGEVAWQRRD VAAVALPVVQ 
AGQSTIAELD AGAVLRKLGI GVVDAVVSAR GQAAAAIAEV GAKGWTRCVV KGNAADVLHR 
NRVGLVEVGV PVERLAEVLE RFERRLDEVS SDPQRSLLIQ PMIAFEDEIG VGALLDPNYG 
PAILIGPGGV GIEAASGERH VLLLSASDEA RAAYQSRVED AYGLAPGTLE PVVAGLERLL 
ATPTISEIDI NPMVRTPDGG LIALDALIVV EPHHPTAAA