Install ChEMBL28 & rdkit cartridge #chemoinformatics #RDKit

Recently ChEMBL 28 was released. It’s good news for chemoinformaticitan and time to update your chembldb ;) Of course I did it. At first I tried to build postgresql chembl28 on my main conda env but it was difficult to install rdkit-postgresql due to some package confliction. So I made clean environment for postgresql/rdkit andContinue reading “Install ChEMBL28 & rdkit cartridge #chemoinformatics #RDKit”

Update conda package of rdkit-postgresql #rdkit #postgresql

Yesterday, I enjoyed mishima.syk #16. Due to recent COVID-19, we moved the meeting to virtual style and worked very well. As same as RDKit UGM 2020, we used Zoom for presentation and discord for discussion and chat. Discord was very useful and easy to use. Thank for all participants and member of the community. TheContinue reading “Update conda package of rdkit-postgresql #rdkit #postgresql”

Fast substructure search module of RDKit #rdkit #memo

Recently I posted an example of substructure search with razi, rdkit postgres cartridge. It works well but sometime I would like to conduct SSS faster. And I could get useful information from Greg, yamasakit. rdSubstructLibrary module can perform fast substructure search! The details are described in rdkit official blog post. https://rdkit.blogspot.com/2018/02/introducing-substructlibrary.html I never tried toContinue reading “Fast substructure search module of RDKit #rdkit #memo”

Ultra fast similarity search with GPU #RDKit #chemoinformatics #postgresql-rdkit

Recently chemoinformatician need to tackle against huge amount of molecules. Search similar molecules from millions of compound database. Last year, schrodinger which is computer science company disclosed useful code for fast compound search module named gpusimilarity. You can get details of the module from schrodingers github repository. URL is below.https://github.com/schrodinger/gpusimilarity/blob/master/gpusimilarity_rdkit_presentation.pdf The algorithm is implemented inContinue reading “Ultra fast similarity search with GPU #RDKit #chemoinformatics #postgresql-rdkit”

Make Drug central ER diagram with python #chemoinfo

Recently I knew useful database “DrugCentral“. From About. DrugCentral provides information on active ingredients chemical entities, pharmaceutical products, drug mode of action, indications, pharmacologic action. We monitor FDA, EMA, and PMDA for new drug approval on regular basis to ensure currency of the resource. By using the site, user can search many information on webContinue reading “Make Drug central ER diagram with python #chemoinfo”

RDKit / PostgresSQL

RDKitはPostgresSQLと連携させて構造情報を色々と扱うことができます。 ChemBL DBはPostgresSQL用のファイルが利用できますし、 ローカルにDBを作って作業すると、自分の幅が少し広がりそうです。 SQLなんかの勉強にもなる? 取りあえずやってみました。 まずpostgresql9.2.4をビルドしました。 マニュアルに従って、、、、 でOK 続いてRDKitの設定 でエラーが出なかったら成功。 途中で何個かwarningでましたが、一応自分の環境では8個のテスト全部パスしました。 ちなみに RDKit2013_03_2 PostgreSQL 9.2.4 BOOST 1.53.0でビルドしました。 で実際にデーターベースを作ってみます。 先ほどのフォルダの直下にdataという1000件のsmilesが入ったファイルがあったのでこれを使ってみます。 これでテスト用のDBを作りました。 続いてファイルを読み込みます。 copy xxx from yyy;でファイルを取り込みます。デフォルトの区切りはタブなのでそのまま。 続いてrdkitの機能を入れる(という表現がいいのか不明ですが) でmolsテーブルができました。 次にプロパティの計算をしてみます。 1000件の分子量とlogpの計算が2秒弱なので早いですね。(と思うんですがどうでしょう。)