align-itを使ってみた

以前からファーマコフォアベースで分子をアライメントするツールをささっとかけると 良いな〜って思ってました。 社内リソースを使おうと思うと、ライセンスの限りがあるのでオンデマンドに解析できなかったりするためです。 RDKitでやっている事例があったのでそれを参考に書いてみたのですが、途中でだんだん複雑になってしまい、ちょっとそのまま放置しています。 そこで、もう少し簡単にということでalign-itを使ってみました。 これは前にも紹介したsilicos-itから公開されているオープンソースです。 Openbabelがカバーするフォーマットを入出力に使えるので、特定のフォーマットに変換するという作業から解放されてよいと思います。 インストールはマニュアルに従って でよいと思います。ubuntuにパッケージマネージャーでopenbabel入れてある状態でやると openbabel2 無い。とエラーがでました。どうもパッケージマネージャーではな入らないみたいですのでこの場合は、自分でopenbabelを最初にビルドしてやるといいかと思います。 続いてテスト用のファイルの準備です。 今回は面倒なんでpubchemでEGFR阻害剤のデータ21化合物をとってきました。 二個目の分子をリファレンス(ref.sdf)としてアライメントします。 結果 .pharにはフィーチャー ファーマコフォアの三次元座標 ガウシアン体積のα値 方向性があるかないかのブール値 そのベクトル のタブ区切りがかえってきます。このデータって何で見れるんだろう??? またオプションの -sはスコアを返すので となりそれぞれの列はマニュアルにあるように column Content —— ——————————————————————— 1 Id of the reference structure 2 Maximum volume of the reference structure 3 Id of the database structure 4 Maximum volume of the database structure 5 Maximum volume overlap ofContinue reading “align-itを使ってみた”

Advertisement

特許をパースする

不勉強にてxmlって ブラウザで見られるけど何これ? と以前思ってました。、、、恥ずかしい よくよく調べるととても便利そうです。 で、xml形式の特許があると解析に使えそうと思うわけです。 集めてきた特許から、番号や、優先日、出願人とかの情報をささっと一覧にできると いいよなーと思っていたこともあったので、 google先生に聞くとそんなことずいぶん前からなされているようでした。。。 さて、xml形式の特許が結構簡単に入手できる環境が整ったので テスト的にスクリプトを作ってみました。 これは同じフォルダにある.xml形式のファイルをを全部読み込んで出願人とかをタブ区切りで出力します。  フランス語とか、エンコでこけるのでアブスとは英語に限定しました。 相当行けてないスクリプト感ただよいますが、一応動いた。のでモチっと改良する予定 xmlの階層構造がそもそも勉強に使っていた例に比べるとかなり入り組んでいたのでまだ不具合たくさん出そうです。 がんばると、テキストなのでバラバラにして複数の出願人がどれくらいの頻度出るかとか、簡単に見れそうです。

最近読んだ文献

行き帰りの電車は文献を読むのにちょうどいい時間だったりします。昼はPythonのスクリプト書いたりRSS眺めてることが多いかなぁ。  週末良さげな文献にほう見つけた。どっちも前に報告はあったけど今回のはそれがまとまってて自分的には刺激的。 A modern in vivo pharmacokinetic paradigm: combining snapshot, rapid and full PK approaches to optimize and expedite early drug discovery  H to L , Lead optimizationの過程において、PKは重要度が高いが、なかなか試験ができないことがままあります(?)。 化合物の主活性ばっかり追い求めて、、、、 はて。と悩むのは行けてないわけですよねぇ。  このレビューではsnap shot PK, rapid PK, full PKそれぞれについての比較を分かりやすくまとめてくれております。  この前のsnap shot PKにフォーカスしたレビューでは全体のシステムの話が詳しく書かれており、こちらも勉強になりました。  snap shot PK, rapid PKはSDがないので、個体差が大きい薬剤の場合多少ぶれるのかもしれません。 でもfull PKとだいたい良い相関示していると書いてあったので、そもそも化合物のクオリティーが高いのかもしれません。  IT進んで情報処理系は結構技術向上してますのでデータをしっかり取る部分がボトルネックになる。現状に甘んじること無くそこをしっかり改善して行くというアプローチは、見習わねば。 A chemistry wiki to facilitate and enhance compoundContinue reading “最近読んだ文献”

shape-itを使ってみた

2Dの分子の類似性を比較する場合、各種FP計算を実施してあれこれ考えるわけですが、 社内的都合にて3Dの場合、ささっと使えるツールが無い訳です。世の中的にはOpenEye社のROCSが使われることが多そうな気がします。文献出の引用例や、ユーザー会のプレゼンをみてもかなり良さげです。 お気に入りのRDKitにはShapeTanimotoメソッッドがありますが、アライメントは別途かける必要があるのでちょいと面倒でございました。 そんなおり、某ワークショップで、silicos-itのshape-itは?と教えていただきました(ありがとうございます)。 winではちゃちゃっとBuildするのは無理そうなんでまずはMacでやってみます。 shape-itのマニュアルを読んでみるとベースにOpenBabelを使っているのでOpenBabelがフォローするファイルフォーマットならなんでもOKという点も良い感じです。 Buildはマニュアルに従って, で準備は完了です。 続いてテスト用のファイルの準備です。全部openbabelでやればいいという噂もありますが、こちらは自分のスキルの都合上RDKitで取りあえずのファイルを作ります。テストファイルはpubchemからもらったDYRK1Kのデータ。 2Dの分子から3D配座を発生させて取りあえずUFFで一応最適化しておきます。 全部の準備が終わったので 実行してみました。 ここでは先頭の分子をreferenceとして使います。 結果 volumeだけの比較になりますが、ちゃんとアライメントもかけて出力してくれそうです。 背景をもう少しちゃんとフォローしてもう少しバリエーションのあるセットで試してみようと思います。 あとは配座発生も考えるとそれなりにバルキーな計算になりそうです。

サファリパーク

今日は家族でサファリパークに行ってきた。少し曇りがちで涼しく良い気候だった。 最初に歩いてぶらぶらと動物を見て、それから車でパーク内を見学。もっと暑さでぐてっとしてると思ったけどそれなりに動物が起きてて子供も結構楽しそうだった。 カピパラ   カンガルー キッツカレー 最初あまり期待してなかったけど思った以上に自分も楽しめた。