某ソフトのワークショップに参加した話

先週、とあるBIツールのワークショップに参加させていただきました。昨年から講演や、ワークショップの話題は何がいいか考える機会が多いのですが、創薬の現場において、もうBIツールそのものは、あって当然のレベルになってきており、導入などの事例やそれだけにフォーカスして何かって話は、もう難しいように思ってきました。 バズワードと言われていたビックデータも現実問題になってきており、データをどう解析してどう使うかが勝負になってきた感があります(だいぶ前からか?)。 懇親会でも議論になったのですが、創薬の実際の現場においては、Data DrivenかExperiment Drivenかというのは、答えのないテーマだと思っています。rationalな分子設計を目指すのであれば前者である。と自分は思うのですが、データ出すには実験しないとならんでしょう。ってのも事実。理想は百発百中。だけどそれは難しい。実際はどちらのスタンスでプロジェクトを進めかは、各ケミストの成功体験がどこにあるのかに依存するんですかね。とすると、そもそも論として成功体験をつかむことが大事となる。でもそうそう上市に結びつくような成功体験なんてそうそうないわけですよ、、、、で、疑似体験として論文や書籍があるかってところですが、この辺はどれだけ論文追ってもきっと見えてこない部分のような気がする。 さて、メドケム向けハンズオンは今回が二回目となります。前回とちょっと趣が変わり、構造を基本的に使わない話題となりました。ちょっとデータセット自体がプアでゴリゴリ解析って感じではなかったことと、ゴール地点が見えにくかった話題でしたが、結構議論が盛り上がったのではと思っています(希望的観測)。 懇親会でのお話がきっかけで続いているmishima.sykもそうですが、いろんな考え方の方が集まってワイワイと議論するってのは、非常に勉強になるし、いいなと改めて思いました。 今回も前回に引き続きおーこんな見方があるのか、と驚くパターンが多く、まだまだ未熟だなあと思う部分が多々ありました。

Generate diamine ring systems using RDKit # RDKit

Somedays ago, I posted new way to represent chemical space using exit vector. So, I want to generate set of diamine ring systems. It’s easy to generate molecule set using RDKit. Let’s try it. At first I defined ring systems. Then, I defined function that returns only unique mols. OK, Ready. Run reaction! It’s worksContinue reading “Generate diamine ring systems using RDKit # RDKit”

calculate exit vector distance of each molecule

Some days ago, I participated a seminar about drug discovery. All presentations were nice, and I interested in one of unique method to representation chemical space, named “exit vector plot”. ref is following Following Ramachandran: exit vector plots (EVP) as a tool to navigate chemical space covered by 3D bifunctional scaffolds. The case of cycloalkanesContinue reading “calculate exit vector distance of each molecule”

Get molecular angle information using RDKit

Now, I’m thinking new molecular similarity score. It uses molecular angle information. RDKit has some functions that calculate dihedral or some angles. Like this.. out put is… 0 N 1 C 2 C 3 N 4 C 5 C Calculate torsion angle. Next, calculate dihedral angle between N-C / C-N. I got -57.29664523229906 ( degContinue reading “Get molecular angle information using RDKit”

New way to plot chemical space.

I often use Principal Component Analysis(PCA) to reduction dimension. Of course, there are several method to reduction dimension, not only PCA but also MDS, kernel PCA, isomap,sammon mapping, ICA, etc. Some days ago, I found interesting method that called t-SNE t-Distributed Stochastic Neighbor Embedding. Key of t-SNE is that use t-Distribution instead of normal distribution.Continue reading “New way to plot chemical space.”