Generative AI Models for Drug Discovery：有关药物分子生成的深度学习模型（综述类文章）| RNN, VAE, GAN, 强化学习RL_深度学习分子生成

作者：从前慢现在也慢 | 2024-08-19 07:20:06

踩

深度学习分子生成

1 Introduction

（1）背景
新药的研发既需要较长的时间，也需要较高的成本。于研究人员来说，在合理的时间内从大量可合成化合物中找到最有希望的候选化合物仍然是一个挑战。因此可以借助AI分子生成模型。
（2）目的
作者回顾了一些AI分子生成模型，并讨论每种模型的优缺点。同时，作者描述了如何将强化学习（RL）算法应用于生成式人工智能，以便在更好地利用分布式硬件的同时获得更真实的效果。

2 分子生成的简单模型：RNN

（1）工作流

在这里插入图片描述

图为RNN分子生成模型的工作流：
①将分子转化为SMILES串；
②使用one-hot coding和embedding来处理字符串，把它们拼接起来；
③然后将它们输入到RNN模型中，得到SMILES串；（可理解为：RNN来预测要生成的下一个原子或者化学键是啥）
④最后将SMILES串变回分子。
在以上过程中学习模型参数，对某一部分进行改变即可得到新分子。
在此模型中，分子被视为序列串，生成分子的任务被转换为生成特殊序列。由于输入和输出都是序列，此类相关序列模型被称为“seq2seq”。

（2）缺点：

① SMILES串非唯一表示，相同的分子结构可以转换成许多SMILES串，如工作流图左下部分；

② seq2seq模型通常关注序列的顺序，因此对一些RNN分子生成模型，它们可能只学习SMILES语法规则，而不是分子结构的知识。

③SMILES串的目的是将分子结构压缩成一维字符串，而不是捕捉分子的相似性，因此具有相似化学结构的分子可以被编码成非常不同的SMILES字符串，如下图。

在这里插入图片描述

在这个图中&

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/1001236