Compound Generator with Graph Networks, GraphINVENT #chemoinformatics #RDKit #PyTorch

Here is a new article from Esben et. al. about de novo compound generator with graph network which is named GraphINVENT. Graph based approach has advantage for compound generation compared to SMILES based approach. It doesn’t need to learn grammar of SMILES. Graph approach represents molecule as graph, atom is node and bond is edge.Continue reading “Compound Generator with Graph Networks, GraphINVENT #chemoinformatics #RDKit #PyTorch”

Advertisement

Difference between santize mol and not sanitize mol #memo #rdkit

I posted about fast compound search with rdkit. And in the post, I used patternfinger print in the post. Today I checked behavior of the fingerprint. Patternfingerprint can calculate molecules which is not sanitized. However the fingerprint is different to the fingerprint which is calculated from sanitized mol. Here is a simple example. The outputContinue reading “Difference between santize mol and not sanitize mol #memo #rdkit”

Does Bigdata and chemists knowledge make good molecular representation? #memo #machine_learning #chemoinformatics

Here is an exciting article published by Alpha A. Lee et al in ACS journal. And the article is freely accessible. URL is below. https://pubs.acs.org/doi/pdf/10.1021/acs.jcim.0c00193 They compared the performance of several molecular fingerprints for QSAR task. It is interesting for me that they used not only traditional ECFP like fingerprint but also ‘CAS fingerprint’. RegardingContinue reading “Does Bigdata and chemists knowledge make good molecular representation? #memo #machine_learning #chemoinformatics”

Relation ship between dihedral deg and atomic charge #psi4 #RDKit #psikit

Recently psikit repository got PR about RESP charge calculation. Thanks for PR. And I have question about the relation ship between compound conformation and partial charge. Fortunately, psikit already has an example for torsion scan thank @fmkz___ for sharing useful code. The example code is here. Following code is same as example code linked above.Continue reading “Relation ship between dihedral deg and atomic charge #psi4 #RDKit #psikit”

Build accurate model with small training data and quantum chemistry #memo #from_ChemRxiv

Recently I read the nice article from ChemRxiv.Here is the link ;) The title is ‘Machine Learning Meets Mechanistic Modelling for Accurate Prediction of Experimental Activation Energies’. I don’t have experience there area but I found and read publications which use Mechanistic DFT. The author mentioned that DFT based approach has difficulties to calculate reactionContinue reading “Build accurate model with small training data and quantum chemistry #memo #from_ChemRxiv”

転職してから5ヶ月位たった #Japanese_entry #diary

今年の三月におよそ15年間努めた会社をやめ転職し、はや5ヶ月が立ちました。 ダラダラ駄文を書いているのは今週夏季休暇で時間があるのと、ご機嫌で麦酒を飲んでいるからです。 COVID-19の影響で出社のタイミングもずれて更にその後も、在宅勤務が続くという想定外の事象に見舞われ最初は面食らいました。ただ、今回の職はデータサイエンティスト的なポジションであり、PCなどの環境があれば在宅でもある程度回せるので意外と快適に過ごせていることに感謝しています。完全にWetの実験からは離れてしまったのでWetの研究者の方とうまくコミュニケーション取らないといかんなという課題は抱えています。 今度の職場はどちらかというと遠方なので、在宅で業務できるのであれば、それを許容するという制度はとても助かっています。通勤時間が省けることで家族と過ごせる時間が増えていました。が、キャッチボールのし過ぎで私の肩と肘はもうボロボロです(笑)。 在宅勤務は環境が整っていれば集中してガシガシ仕事ができるというメリットがある反面、いきなりこの環境に置かれると、職場の方とのコミュニケーションがうまく取れず雑談から生まれるひらめきとかが得られなかったり、ひたすら生産性向上のプレッシャーに苛まれるという負の面もあるように思います。私はキャリア採用で、ある程度自分のやりたいことや、求められていることがある前提だったので、まだマシな部類なのかもしれません。それでも一人で黙々と作業していると快適である反面ストレスが貯まることもあります。そんなときは炎天下のお昼にランニングしていますが、、、 幸いにもSNSなどを通じて情報発信すると色々レスをいただけることがうまく自分のモチベーションキープや息抜きになっています。自分は2010年にTwitterアカウントを作成したようなのでもう10年位Twitterをやっているようです。Blogもまあまあ長い間ひっそり書いています。義務ではなく思うままに書いているといったスタンスが継続に繋がっているのかもしれません。また、これを通じていろいろな方とつながりが持てていることは現在のIT技術のおかげであって、感謝感謝です。自分がインターネットを最初に始めたのは高校生の頃で、モデムを使って64kbps、ホワイトハウスのコーヒーメーカーの画像をネットスケープナビゲータで描画して感動していました。 在宅で業務をできる人がいる一方で、出社しないと業務が進まない方がいらっしゃるのも事実です。製薬もいくら正確な計算予測ができても最後はWetな実験での検証が必須であり化合物の合成、評価がなくては絵に書いたモチで終わりです。というこで、私はやっぱりWetな実験をしっかりこなしデータを出してくださる研究者の方への尊敬、感謝の念をなくすことはできないなー、なくしたらだめだなーって思っています。 Wet一筋の方の目線から見てこちらがどう見えるかは人それぞれなのでどうでもいいのですが。なにはともあれお互いの信頼関係をいかに築けるかが大事だとは思っています。 まだまだ足りないことが多すぎてどうにもならないストレスばっかり貯まる日々ですが腐らず引き続き頑張っていこうと思った猛暑の夜でした。 気がつけばもうすぐ転職して半年、、、、早く結果にコミットしないとやばいですねw

Get and Draw molecular fragment with user defined path #RDKit #memo

Chemical structure can represent as graph atoms as nodes, bonds as edges. And some compound fingerprints based on the graph. These algorithm extract fragment from molecule given radius of center atom. To get atom environment of RadiusN, FindAtomEnvironmentOfRadiusN method or rdkit is useful. It can get fragment from molecule with given radius of specific atom.Continue reading “Get and Draw molecular fragment with user defined path #RDKit #memo”

The article about the guideline of RNN based molecular generation #memo #chemoinformatics

I’m in summer vacation from today. Due to pandemic, we don’t have plan to go travel in this summer vacation ;( Hope the situation will go soon…. As reader know recently SMILES based de novo design is used for not only material design but also drug discovery project. Some years ago, the approach generates manyContinue reading “The article about the guideline of RNN based molecular generation #memo #chemoinformatics”

What is scaffold / Medicinal chemist feeling #memo

Recently I’m interested in the following article. https://pubs.acs.org/doi/abs/10.1021/acs.jcim.0c00204 The author tried to detect chemical series (scaffold) like medicinal chemist. In the drug discovery project chemical series / scaffold is very important concept to analyze compounds SAR but it is fuzzy. As chemoinformatitian know Bemis-Murcko scaffold is one of the solution for systemic detection of chemical seriesContinue reading “What is scaffold / Medicinal chemist feeling #memo”

Use Hash value in python code #memo

Recently when I reading a code and test it, the code didn’t work. ;( The code used python hash function for generating some values. This is the reason why the code didn’t work in python3. Python3 hash function returns same value in only same session. So it should not use as permanent value. For example…Continue reading “Use Hash value in python code #memo”