relative drug likehood

これ結構前からASAPに載っていたのですがなかなかPublishされなくてやきもきしていましたが最近publishされました。
ドラッグライクネスの尤度比。とでも言うのでしょうか。
ちょっと前に発表されたQEDに続くスコア化の論文です。
 この著者の属する、optibriumはstardropというなかなか素敵なツールを展開していますね。
 さて、RO5に代表される指標は明確なカットオフを指定できるものの、
ルールにすると問答無用のハードフィルターになります。
QEDは複合的なパラメータを指標にします。従って上記のカットオフ問題を回避できます。ケミストの感性とも結構良い相関を示しています。
 ただ、今までの薬と似ているから成功する訳でもないでしょうということで
ベイズ確率論に従ってプロパティXを持っていた際の薬になる事後確率を考えます。
P(Drug|X) = P(X|Drug)P(Drug)/P(X) => P(X|Drug);尤度、P(Drug);事前確率
同じくnon drugに関しても
P(no_Drug|X) = P(X|no_Drug)P(no_Drug)/P(X)
で比を考えます
P(Drug|X)/P(no_Drug|X) = {P(X|Drug)*P(Drug)} / {P(X|no_Drug)*P(no_Drug)}

ここで
P(X|Drug)/P(X|No_Drug)をd(x); desirebilityとします。
P(Drug)/P(no_Drug)はとても小さい値なので定数項としてしまいます。
no_drugはChemBLのデータを使っていました。(ランダムに1000)
XはMW, TPSA, ,,,諸々のものなので結局
RDL はそれらを込み込みにして
RDL = exp(1/n * Σln(d(x)))と定義して計算します。
でこういった文献は、丁寧なのでSIの方にコードが乗っかってます。
興味のある方こちら
早速使ってみます。
ファイル解凍後readmeを見ればいいのですが
指定するのは
rdl_compute.rというスクリプトファイルの
working_directory <- "C:\\Users\\UserName\\Documents\\QED"

pos_set_filename <-
neg_set_filename <-
input_filename <-
output_filename <-
です。pos/ neg fileにデフォルトで入っているファイルは提供されていないのでDrugs.csv, ChEMBL09.csvとかにするといいと思います。
このスクリプトはどうもQED出力の結果をそのまま使う仕様なので
プロパティーは必要なら変えるとか対応が必要です。
input_filenameも基本構造情報はいらなくて計算に必要なプロパティーだけあればオケです。
ここまで指定して実行すればoutput_fileに書いた名前の出力が得られます。

後一点注意はソースコードで
classcountsが定義されておらずそのまま実行するとエラーになります。
従って
classbdries <- NULL
classcounts <- NULL #この辺に入れとくのがいいと思います。 
proportions_pos_set <- NULL
proportions_neg_set <- NULL
rel_likelihood <- NULL

プロジェクトの化合物を計算してみてggplot使って密度プロット等すると
結構いいと思うんですけど〜

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s