RDKitでRグループを抜き出す。

化合物を色々と合成していると、中心構造が同じならそこにつく置換機の情報だけを抽出したい場合があります。
たとえば縦横マトリックスを書いて考えたいなんて場合とか。。。

from rdkit import Chem
mols=Chem.SDMolSupplier("hogehoge.sdf")
core = Chem.MolFromSmiles("c1ccccc1)
for m in mols:
    r=Chem.ReplaceCore(m, core)
    print Chem.MolToSmiles( r )

とすると
コア構造が抜かれて各側鎖がピリオドで区切られたsmilesが得られます。
split関数等で分割してあれこれ解析に使えると思います。

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s