赞
踩
题目:Adaptive language model training for molecular design
文献来源:Journal of Cheminformatics (2023) 15:59
代码:https://code.ornl.gov/candle/mlmol in the adaptive-lm directory
简介:巨大的化学空间需要计算方法来自动化和加速分子序列的设计,以指导药物发现的实验步骤。遗传算法提供了一个有用的框架,通过将突变应用于已知的化学结构来逐步生成分子。最近,掩码语言模型已被应用于自动化突变过程,通过利用大型化合物库来学习常见的化学序列(即使用标记化),并预测重排(即使用掩码预测)。在这里,作者考虑如何适应语言模型来改进分子优化任务的生成。本文使用两种不同的生成策略进行比较,fxed和自适应。fxed策略使用预先训练的模型来产生突变;自适应策略对优化过程中为目标属性选择的每一个新一代分子训练语言模型。研究结果表明,自适应策略允许语言模型更接近于分子在种群中的分布。因此,为了增强精确度优化,作者建议在初始阶段使用fxed策略,然后使用自适应策略。作者通过搜索能够优化启发式指标、药物相似性和可合成性,以及从替代模型中预测的蛋白质结合永恒性的分子,来证明适应性训练的影响。结果表明,与fxed预训练模型相比,自适应策略显著改善了度优化,使语言模型在分子设计任务中的应用。
主要内容:
-------------------------------------------
欢迎点赞收藏转发!
下次见!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。