Look Back at 2020

I’ve started the blog site from Aug. 2012. So it took over 8 years. And in this year there were more access and comments than last year thanks so much. Here is an page view and visitor count bar chart of the site. I also surprised that any access from many countries not only JapanContinue reading “Look Back at 2020”

Advertisement

Embed molecular editor into Streamlit app #streamlit #chemoinformatics #RDKit

I wrote some posts about usage of combination chemoinformatics and streamlit. One was predictive model application which was used rdkit and scikit-learn. When I tweeted that, Jan Jansen (who is Great quantum chemist and I met him RDKit UGM!!!) commented me that it is useful that if molecular drawer can use in the app ;)Continue reading “Embed molecular editor into Streamlit app #streamlit #chemoinformatics #RDKit”

Chemoinfo のアプリをStreamlitを使ってDeployする #streamlit #RDKit #souyakuAC2020

みなさんこんにちは。お元気でしょうか。私はなんとか風邪にもならず過ごしております。寒くて朝起きれなくなってきたIwatobipenです。 今年はネタもない+なぜかいろいろ忙しくて参加しないつもりでしたが、少しでもコミュニティーに貢献しようと思いまして、小ネタを提供することにしました。創薬感はゼロですがご容赦ください。 皆さんStremlitはご存知でしょうか。Qiitaなどにも記事がありますが、PythonだけでイケてるUIもコミコミのデータ解析Appを作れてしまうパッケージです。 機械学習と組み合わせるのであればモデルを作っておいて予測アプリをこれで提供するなどが簡単にできます。ちょっと前にこのStreamlitとRDKITを組み合わせたアプリに関する記事をポストしました。https://iwatobipen.wordpress.com/2020/12/11/make-interactive-web-app-with-streamlit-and-rdkit-rdkit-streamlit/ その後いろいろドキュメントを見ているとStreamlit はWeb上にデプロイできるようです。share する場合はしたのページからGithubと連携させる必要があります。https://www.streamlit.io/sharing 手順はこちらに書いてあります。https://docs.streamlit.io/en/stable/deploy_streamlit_app.html サンプルのコードはこちらに置いてあります。コードの話は前の記事に書いてあるのですが変更点が二点あります。Shareするようにした場合、Streamlitから提供されるVMに環境がデプロイされます。requirements.txtに通常のパッケージ以外にPipで入れる必要があるパッケージを記載します。 そのあとしばらく悩んだんですけどRequrementsにCondaのPackage書いても入りません。私の大好きなRDKitはここに書いても入らないんです。その後解決策がわかりました!下のようにconda.txtにパッケージ名を書きます。チャンネルを指定したい場合はconda_channels.txtに指定しておきます。 ↓ rdkit だけですと、VM上でインストールできなかったためconda.txtはGCCも入れています。 ここまでお膳立てしておくとWeb上でStreamlitAppが配布できるようになりユーザー側に環境整備の必要がなくなります。 実際の成果物がこちら  https://share.streamlit.io/iwatobipen/chem_streamlit/main/chemstreamlit/app.py アクセスすると、プルダウンで化合物インデックスを選ぶようになっていて選ぶと該当する分子の溶解度予測の結果と構造が描画されるようになっています。 App.pyはGithubを見ていただければだいたいわかると思いますがこんな感じ。ファイルのPathなどがVMの中で見えるようにするために変えてあります。 分子のイメージは中間ファイルを出さないようにByteioオブジェクトを使って渡す仕様にしました。今回は例示していませんが同じテクニックを使ってMatplotlibの図とかも埋め込めたりします。StreamlitはwriteでMatplotlibのFigを受け取れるのでこみいったことはしないでもいけるはずですが。他の場合に使えるかもですw。 Google colabなどRDKIT入れるのちょっと面倒だったりするので、アプリを作ってShareする場合、Streamlit使うとユーザー側は環境を構築しないでテストできるので良いですね。と思いました。 公式ドキュメントにはCondaパッケージ使えるとは書いてあるけどどうやって指定するかは書いていなくて困っていたんですが、Stremlitのコミュニティーに聞いたら一瞬で解決しました。感謝感謝です。 オープンソースのパッケージ+アクティブなコミュニティーはデータサイエンスにとって貴重ですね。 ライトな話題ではありましたが何かしらの参考になれば幸いです。 おしまい。

Update shape-it and align-it #structure_align #chemoinformatics #OpenBabel3

Shape and Pharmacophore based molecular alignment methods are often used not only SBDD but also LBDD projects. ROCS is one of the major tool to do it but it’s commercial package for none academia. Shape-it and Align-it which are provided from silicos-it are very useful open source packages for molecular alignments. I posted about shape-itContinue reading “Update shape-it and align-it #structure_align #chemoinformatics #OpenBabel3”

Make interactive web app with streamlit and RDKit #RDKit #streamlit

Recently @napoles3D shared very useful code which shows integrate rdkit and stremlit. Here is the code. https://github.com/napoles-uach/streamlit_apps/blob/main/Streamlit_Colab/01_Streamlit__Colab_RDKit.ipynb So I have interest about integrate rdkit and streamlit because streamlit can make web app easily without considering and making UI like jupyter notebook. So today, I would like to share an example to integrate rdkit and streamlit.Continue reading “Make interactive web app with streamlit and RDKit #RDKit #streamlit”

Useful ML tool for chemoinformatics #chemoinformatics #RDKit #Machine learning

Yesterday, I moved my main PC from Ubuntu18.04 to 20.04LTS. Now it works well. And I’m building new(clean) env for my coding. Today I would like to share useful package for machine learning named pycaret. Brief introduction of PyCaret is below. —from original site—PyCaret is an open-source, low-code machine learning library in Python that automatesContinue reading “Useful ML tool for chemoinformatics #chemoinformatics #RDKit #Machine learning”