Gene RPD_0353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0353
Symbol
ID	4020818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	417000
End bp	418610
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	60%
IMG OID	637960537
Product	AMP-dependent synthetase and ligase
Protein accession	YP_567492
Protein GI	91974833
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000011697
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCGGACG CAGAGGATAT CAAGCTCGCG ACCATCTCCG ATCAGGCGAC CAATCTCGCG 
CGGCGGGTGA ATGTCGGTGA CATCACAAGA CGAGGTGCGC GCCGTCATCG CGACAAGATC 
GCCGTTATCA TGGGCGAGAC CCGTCTCACA TACGGCGAAC TGGACGCTCG GGCGAACCGC 
ATCGCGCATG GATTGCTGGC GATGGGCTTG GGCAACGGGG CCCGCATCGG CGGCCTCGCC 
CGAAACTCGA TCGACTTCCT GACATTGTAC TTTGCAGCAG CAAAGGCTGG CGCGATCTTC 
TGCCCGTCCA ATCCAGCAAT TCCTGACGCG GATCTCGTTC ATATCCTTGG TCATGCCGAG 
GTTTCGGCAA TCTTCATCGA TCCTGACCGG CACCAGCAAT TCACCGCTGT CGCATCCCAG 
GTGCCTTCCA TCAGAAAGAT ATTCTCCGTC GGCGGCAACG GGCAGGCAGA TTCGCAGCTC 
GACTCGCTGG CGGTGATCGC CGAAGGGCAA CCTGCAATCG ATCCGGAGAC CGCGACAGGC 
GATCGTGATG TCGCCATGAT CATGTACACC AGCGGAACGA CCTCCGCCCC CAAGGGAGCG 
ATGTTGTCGC ACATCAACGT GACAACTGGC GCCGTGCACA ATGCGTTCGC GGGCGAGGTC 
GACGAGAACA CCATCGCAAC CGCCATACTA CCCTTGTTTC ATTGCGGTCA GCTATCAATC 
AGCAGCGGAA CGTTGATGCG TGGAGGCACC GTCGTCGTTT TCGACGGGTT CGAACCCGCA 
GCCCTCCTGG ACGCGATCGC GCGCGAACGC ATCACCTGGC TATTCGCTCT TCCCGCGATG 
TATCGCGCCC TCCTGGCGCA TAAGGATCTC GACAACACGG ACGTGTCGAG TCTCGCATTC 
TGTTTGTATG CGATGGCTCC GATGGATCCT TCGACGCTGC GCGAAGCGTC GCGCAGGCTC 
AAGGCTCGCT TCGCACTCAC CAGCGGACAG ACGGAAGCCT ATCCGCCGAC GGTTGTATTC 
GCTCCGGAAT TTCAGTTGAC CAAGCACGGC GCCTTTTGGG GGCGCGCCAT GCCCTTGGTC 
GATTTGGCAA TCATGGACGA CGATGGGCGC CTGGTCGAGG ACGGATCCGT CGGCGAAATC 
GTCTATCGAG GTCCGATGGT CATGGAAGGG TATCTGAAAG ATCCGGAAGC CACAGCTCGG 
GCGTTCGAGG GCGGTTGGTT TCACTCCGGC GATCTCGGGC GCTTCGACGA AGACTCGCTG 
CTCCTCTTCG TCGACCGCAA GAAGGATATC ATCAAGTCGG GCGGAGAAAA CGTCTCATCC 
GTCAAGGTGG AGAGCTGTCT CCTTGCCCAC CCGGCGGTGC GGGCTGCGGC GATTGTCGGC 
GTGCCTCACA GCCGTTGGAG CGAGGCCGTT GTCGCTGCTG TTTGCCTGCT TCCGGGTTCA 
GTGGAAGACG AAGGGCAATT GATCGCCCAT TGTAAACAGA CACTCGCACC CTTCGAAGTC 
CCGAAGAAGA TTGTCTTCTA CCGTGAGCTT CCCCAGACAG CGACCGGAAA GCTCCAGAAA 
TATCAGATCC GGGGCGAGCT CGAAAACCTG TTTCGCGACC AGACGAACTG A

Protein sequence

MSDAEDIKLA TISDQATNLA RRVNVGDITR RGARRHRDKI AVIMGETRLT YGELDARANR 
IAHGLLAMGL GNGARIGGLA RNSIDFLTLY FAAAKAGAIF CPSNPAIPDA DLVHILGHAE 
VSAIFIDPDR HQQFTAVASQ VPSIRKIFSV GGNGQADSQL DSLAVIAEGQ PAIDPETATG 
DRDVAMIMYT SGTTSAPKGA MLSHINVTTG AVHNAFAGEV DENTIATAIL PLFHCGQLSI 
SSGTLMRGGT VVVFDGFEPA ALLDAIARER ITWLFALPAM YRALLAHKDL DNTDVSSLAF 
CLYAMAPMDP STLREASRRL KARFALTSGQ TEAYPPTVVF APEFQLTKHG AFWGRAMPLV 
DLAIMDDDGR LVEDGSVGEI VYRGPMVMEG YLKDPEATAR AFEGGWFHSG DLGRFDEDSL 
LLFVDRKKDI IKSGGENVSS VKVESCLLAH PAVRAAAIVG VPHSRWSEAV VAAVCLLPGS 
VEDEGQLIAH CKQTLAPFEV PKKIVFYREL PQTATGKLQK YQIRGELENL FRDQTN