赞
踩
传统的计算分析和机器学习是否可以弥补在信息泛滥的情况下对药物重定位论文进行同行评审的不足?
COVID-19的流行改变了科学和临床成果的分享和传播方式。根据最近的一项分析,平均每周有367篇COVID-19论文发表,从提交到被接受的中位时间仅为6天(而非COVID-19内容则为84天)。这些前所未有的同行评审周转时间--在某些情况下还放宽了编辑标准--在新信息可能加快对新出现的全球医学-社会-经济灾难的了解和解决方案的背景下是合理的,但它们也有可能发布初步或有缺陷的出版物,这些出版物可能误导研究和开发工作,损害临床实践,并误导决策者。如何弥补大流行病背景下同行评审的不足?在此,作者提出了一个策略,即严格的社区和同行评审与使用人工智能相结合,以优先考虑文献中描述的研究和治疗替代方案,使社区能够将资源集中在经过适当和彻底的临床测试的治疗上。
当论文弄错了
1998年,Andrew Wakefield和他的同事发表了一篇论文,将疫苗接种和自闭症联系起来。那篇论文发表12年后--因为它暗示了免疫和自闭症之间的因果关系,这个错误的举动让全世界数十万父母反对给孩子接种疫苗--《柳叶刀》在2010年2月宣布,Wakefield论文中的 "几项内容""是不正确的,与之前的研究结论相反"。
因此,广泛传播不够严谨的临床科学的风险并不是一个新问题;然而,COVID-19的流行加剧了这一问题,因为它促使初步研究结果的发布,而这些研究结果随后可能会根据新的证据进行修改,或者在某些情况下被证明是完全错误的。最近建立的未经同行审查的预印本服务器进一步加剧了这一问题,大大降低了发表论文的门槛,绕过了关键的同行审查。
鉴于缺乏有效的疫苗和经过验证的抗SARS-CoV-2的治疗选择,生物医学科学家正在竞相发表关于可快速部署的治疗方案的建议。虽然新的化学和生物实体正在被评估为SARS-CoV-2感染的潜在疗法,但重新定位和药品核准标示外使用被批准用于不相关疾病的现有药物被广泛倡导为对抗COVID-19的治疗方法。药品核准标示外使用允许几个小组在临床研究中报告一些药物的潜在疗效。Table1总结了一些正在进行临床评估的重新定位建议,其中许多是研究者提出的。
羟氯喹的传奇
一个典型的例子是在COVID-19中使用羟氯喹(hydroxychloroquine, HCQ)和阿奇霉素。潜在的第一个证据来自雷米西韦和氯喹(chloroquine, CQ)的组合体外研究--一种结构上与HCQ相关的药物--其中报道了SARS-CoV-2的生长抑制。原文于1月25日提交给《细胞研究》,1月28日仅经过三天的同行评审就被接受,并于2月4日发表。这篇论文发表后,《生物科学趋势》的编辑也收到了一封信。
3月初,来自法国马赛IHU-Méditerranée Infection的一个医疗小组使用HCQ来治疗SARS-CoV-2感染的患者。这项开放标签、非随机临床试验的结果于3月16日提交给《国际抗菌药物杂志》,3月17日接受,3月20日发表。该报告提示,HCQ与阿奇霉素联合使用,可成功清除SARS-CoV-2感染。然而,经过仔细研究,这篇论文报告了总共只有26名患者中只有14名患者(在HCQ单药治疗组)和6名患者(接受与阿奇霉素联合治疗以防止细菌超级感染)的数据。尽管作者在研究中正确地提到了样本量小、随访时间很短的事实,但他们还是建议这两种药物可以作为COVID-19的治疗和预防疗法。
其他几项试验对这份报告进行了跟进,同时在非专业媒体上发表了许多出版物。到目前为止,这些试验的结果还没有定论.然而,2020年3月的原始研究导致了对HCQ的巨大活动和关注,对整个工业、医疗、政治和社会环境产生了严重影响。虽然缺乏植根于一个多世纪的药物安全经验的严格的循证结果,但大规模的努力已经集中在HCQ作为COVID-19疗法,具有全球影响。各大跨国公司响应政府领导的要求,加紧制造CQ和HCQ。其他国家纷纷囤积产品,而监管部门在没有有效剂量或安全方案数据的情况下,匆匆忙忙地对这些药物进行紧急审批。相关研究均未明确提及药物现有的形态学和药代动力学特性(如剂量、半衰期和清除率),而这些特性对原适应症的应用指导和批准至关重要。
临床界并没有等到更确凿的试验结果。而FDA最初的认可在不到3个月的时间里就被撤销,但许多自我治疗的患者和开HCQ的医生却忽视或批评了随后的研究结果。由于HCQ缺乏疗效的证据不断被公布,治疗的支持者提出了更多的因素,如缺乏锌盐与HCQ的结合,作为负面临床结果的解释。
经验教训
导致《国际抗菌剂杂志》论文发表的为期一天的同行评审过程非常不规范。如果有一个正常的同行评议过程,很可能会确保引发这一事件的刊物不得不参考和讨论此前3月6日发表在《浙江大学学报》上的Chen等人关于HCQ的一项失败的临床研究。在那项针对30名COVID-19患者的对照、开放标签研究中,服用该药的患者中有13人在7天后病毒检测呈阴性,而服用安慰剂的人中有14人。服用HCQ的患者中有一人后来发展成重症,两组患者的中位康复时间相似。这项研究尽管只针对一小部分患者,但得出的结论是,HCQ并不比标准护理更有效。
IHU-Méditerranée感染小组发表的文章根据一小部分病人的样本提出了相互矛盾的数据。该文章根据微弱的证据提出了雄心勃勃的主张,而这些证据似乎只经过了最低限度的同行审查,但却发表在一份受人尊敬的同行审查期刊上。3月19日,在这篇文章提交后但在它发表之前,白宫新闻秘书宣布,HCQ对COVID-19的早期结果令人鼓舞。此后,基于Twitter和电视的信息风暴声称通过HCQ、阿奇霉素和硫酸锌的治疗 "100%治愈 "COVID-19,无需住院或使用呼吸机。4月10日发布的一项位于中国武汉的随机临床试验的预印本显示,62名轻度SARS-CoV-2感染患者在服用HCQ后缓解时间和体温恢复时间较短,而一项针对150名中国患者的同行评审研究报告称,病毒转化率没有差异。
3月28日,FDA(但不是欧盟)批准了CQ和HCQ对某些住院患者COVID-19的紧急使用授权(EUA)。FDA在6月15日撤销了EUA,此前,FDA对HCQ的副作用,特别是QTc延长导致的致命性心律失常的可能性,以及其他心脏事件提出了一系列附加警告。尽管在过去的几个月里收集了更多的证据,执行HCQ在预防场合缺乏益处,但人们仍然主张预防性自我用药。无论是从IHU-Méditerranée感染组发表的研究,还是任何后续的研究拥抱HCQ作为COVID-19的有效治疗,结果都是可重复的。然而,尽管这些药物在科学上存在弱点,但它们却成为政治关注的对象,造成这些药物在全球范围内的短缺,影响了有合法治疗需求的患者接受治疗自身免疫性疾病的药物。
最初的两份高危人群调查报告绕过了现有的科学制衡机制,突出了健全的同行审查的重要性,这在全球危机期间披露新疗法时尤为重要。确保科学出版物接受严格的同行审查,即使在紧急情况下也是至关重要的。
如何处理错误信息?
寻找这场危机的即时医疗解决方案时,必须从HCQ的经验中学习。COVID-19大流行导致了前所未有的其他治疗建议,从同行评审和预印本出版物到博客文章、推特、电视和其他传播渠道。无论多么合理或健全,这么多的建议都无法由任何一个团体、机构或监管机构进行系统的评估和优先考虑。显然,需要了解不断增长的数据流、信息流和知识流,以便对其进行实时整理、处理和架构。
基于字典的文本挖掘,加上专门的人工智能(AI)或原本称为统计模式识别的机器学习(ML),如双向生物医学语言表示模型BioBERT,可以帮助实现这一潜力。严格的、以证据为基础的同行评审加上开放的数据和计算机辅助技术,为摆脱困境提供了一条出路,并为在危机中取得合理的科学突破提供了机会(Box1)。虽然预印本服务可以迅速传播新的研究成果,但它们没有经过同行审查,很容易误导非专家,鼓励公众进行耸人听闻的错误报道。目前,在前瞻性验证研究中,有一些可解释的AI/ML系统,旨在根据多组学数据、化学和文本信息预测临床试验的结果。在预测结果与公布结果不一致的情况下,这些系统可以用来告诫监管者,鼓励他们进行更仔细的审查。全面的端到端人工智能驱动的药物发现系统,可用于临床试验结果的再利用和预测。
临床药物开发需要不同领域的专门知识。实时编纂的无偏见的临床数据应该不受限制地提供,而且应该为这次和今后的大流行病放弃知识产权。虽然目前正在进行协调努力,但这一流行病提供了一个独特的机会,可以为全球同步工作流程奠定基础,确保数据的真实性,对治疗方案进行公正和多角度的评估,并有效分配计算、人力和实验资源。这必须在允许同行审查、事实核查和纳入相关领域专门知识的情况下进行。
传统上,这些活动都是在实验室进行,然后进行人体临床试验。鉴于动物研究设施几乎完全关闭,需要进行重点合理的临床试验,值得探讨的是,这些活动中的许多活动如何能够被现在通过计算技术(如ML、系统生物学和计算机辅助药物再利用)获得的能力所补充甚至取代。这些技术近年来已经成熟,并已准备好成为全球工作流程的一个组成部分,以确定新的药物靶点和新的化学实体的优先次序,以及评估标签外或药物重新定位的建议。通过整合多层数据、信息和知识,并处理大量的重新定位建议,经过验证的基于机器智能的方法可以在不久的将来成为决策者、医疗服务提供者和整个社会的决策支持系统。如果有适当的资源和实施,这样一个同步的工作流程可以帮助将不同的证据和假设汇集成可操作的医疗解决方案,以应对当前和未来不可避免的流行病。
实践中,部署AI/ML方法需要全面了解其优势和弱点。AI/ML对于在大量非线性数据集中识别相关模式是非常强大的,而不需要进行人工特征工程,因为系统可以从提供的数据中学习隐含规则。虽然训练这种算法所需的数据量可能是一个问题,但AI/ML对大量数据的理解能力在许多情况下是一个优势。AI/ML提供了解决这两个问题的替代方法。
ML已经开始用于识别异质性疾病的治疗干预的生物靶点,并找到与这些靶点结合的合适候选药物。同样,如果在一篇论文中的经验性临床观察被用来提出一种药物作为潜在的治疗方法,ML可以而且应该被用来快速模拟人群的疗效和副作用。使用ML方法的同步工作流程可以基于现有的资源来分析靶点、药物和相关的潜在副作用,它结合了临床试验过程中记录的药物、靶点和副作用的数据,以及FDA不良事件报告系统,它可以获得以前提交给FDA的不良事件报告和药物错误报告。
关于SARS-CoV-2的生物学和作用方式仍有一些未知数。然而,关于病毒基因组序列的信息、发现病毒用于感染细胞的受体以及对病毒结构的了解,使人们能够确定直接作用的抗病毒药物的潜在靶标。随着群体尺度病理数据的出现,人们已经清楚地认识到,宿主免疫反应过度活跃是导致更严重疾病的明显驱动力。自然而然,数据收集、分析策略和治疗发现的重点都是针对这些数据的。
ML算法还可以通过自动识别合适的受试者,确保正确地分配到各组研究参与者,并为没有产生有意义结果的临床试验提供预警系统,从而加速临床试验的设计。计算药物再利用可以加速药物开发过程,降低相关成本。为了确定正确的重用候选药物,重要的是确定已知的分子靶点,预测已知药物的新分子靶点,并考虑剂量、药代动力学和安全性相关参数。ML能够分析数以百万计的药物和患者数据实例以产生假设,然后提供支持或挑战这些假设的证据,因此,ML可用于确定已知药物的新适应症,并以各种方式组合现有药物,使其具有各自单独缺乏的治疗能力。
医疗保健和药物发现中,AI/ML应作为人类工作流程的辅助手段而不是替代手段来实施。AI/ML的整合提供了强大的选择,但只有在多学科团队内才能取得成功,这些团队可以确保AI/ML解决方案适应每个特定情况。从这个角度来看,在药物发现和开发以及临床实践中,人类的专业知识和最终决策仍将至关重要。目前,在药物发现或临床实践中大规模整合AI/ML技术的例子很少。药物发现中,一个药物进行临床前测试和临床试验的时间框架特别长,需要更多的时间来评估其真正的影响。
结论
COVID-19大流行病突出表明,需要有新的工具来补充现有的同行审查机制,以确保所发表的生物医学信息的真实性和可靠性,从而指导临床实践和制定公共卫生政策。它还表明,研究界有能力在短时间内产生大量的异质数据--这些信息的规模和速度可能会混淆人类的解释。这种情况下,研究者认为AI/ML在支持数据以补充同行评审论文方面具有关键作用。呼吁快速开发和前瞻性验证全面的、可解释的AI/ML系统,这些系统使用临床前和临床数据,不仅能够快速预测临床试验结果,还能突出已发表工作中可能存在的缺陷以及导致失败概率增加的特征。
参考资料
Levin, J.M., Oprea, T.I., Davidovich, S. et al. Artificial intelligence, drug repurposing and peer review. Nat Biotechnol (2020).
https://doi.org/10.1038/s41587-020-0686-x
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。