Ultra fast similarity search with GPU #RDKit #chemoinformatics #postgresql-rdkit

Recently chemoinformatician need to tackle against huge amount of molecules. Search similar molecules from millions of compound database. Last year, schrodinger which is computer science company disclosed useful code for fast compound search module named gpusimilarity. You can get details of the module from schrodingers github repository. URL is below.https://github.com/schrodinger/gpusimilarity/blob/master/gpusimilarity_rdkit_presentation.pdf The algorithm is implemented inContinue reading “Ultra fast similarity search with GPU #RDKit #chemoinformatics #postgresql-rdkit”

Make Drug central ER diagram with python #chemoinfo

Recently I knew useful database “DrugCentral“. From About. DrugCentral provides information on active ingredients chemical entities, pharmaceutical products, drug mode of action, indications, pharmacologic action. We monitor FDA, EMA, and PMDA for new drug approval on regular basis to ensure currency of the resource. By using the site, user can search many information on webContinue reading “Make Drug central ER diagram with python #chemoinfo”

RDKit / PostgresSQL

RDKitはPostgresSQLと連携させて構造情報を色々と扱うことができます。 ChemBL DBはPostgresSQL用のファイルが利用できますし、 ローカルにDBを作って作業すると、自分の幅が少し広がりそうです。 SQLなんかの勉強にもなる? 取りあえずやってみました。 まずpostgresql9.2.4をビルドしました。 マニュアルに従って、、、、 でOK 続いてRDKitの設定 でエラーが出なかったら成功。 途中で何個かwarningでましたが、一応自分の環境では8個のテスト全部パスしました。 ちなみに RDKit2013_03_2 PostgreSQL 9.2.4 BOOST 1.53.0でビルドしました。 で実際にデーターベースを作ってみます。 先ほどのフォルダの直下にdataという1000件のsmilesが入ったファイルがあったのでこれを使ってみます。 これでテスト用のDBを作りました。 続いてファイルを読み込みます。 copy xxx from yyy;でファイルを取り込みます。デフォルトの区切りはタブなのでそのまま。 続いてrdkitの機能を入れる(という表現がいいのか不明ですが) でmolsテーブルができました。 次にプロパティの計算をしてみます。 1000件の分子量とlogpの計算が2秒弱なので早いですね。(と思うんですがどうでしょう。)