RDKitとPythonを使ってデータを加工して
Rで解析するというケースを頻繁にやっていると全部つながるといいなーと思います。
RPY2を使ってうまく繋げるのもいいですがKNIMEを使うとそれぞれの連結ができて便利かも。
ということでトライしてみました。
KNIME上のRノードでは全部Rという名前のオブジェクトに対して処理をするようで
それを理解するのに時間がかかりました。
例えばPLS回帰をする場合はこんな感じです。
Rノードおのおのでplsパッケージ読み込まないと、
おいおいmvrなんて扱わないぜ。とおこられます。
R<-R library("pls") R<-data.frame(R[,-3]) R <- plsr(pIC50~., data=R, ncomp=20, validation="LOO")
で作ったのはこんな感じです。
一個はモデルを作ってモデルと実測を比較するため
もう一個はモデルに当てるためのフローです。
RDKITノードでディスクリプタは簡単にとれるし、そのあとのモデリングは上のようなスニペット書いとけば後はよろしくな感じでいいので、楽できそうです。
ローカルで全部やってるからパフォーマンスが悪い、、、
まあいいか。