LLM之幻觉（二）：大语言模型LLM幻觉缓减技术综述

作者：繁依Fanyi0 | 2024-03-27 03:46:24

踩

LLM幻觉缓减技术分为两大主流，梯度方法和非梯度方法。梯度方法是指对基本LLM进行微调；而非梯度方法主要是在推理时使用Prompt工程技术。LLM幻觉缓减技术，如下图所示：

LLM幻觉缓减技术值得注意的是：

检索增强生成（RAG）
知识检索（https://arxiv.org/abs/2307.03987）
CoNLI（https://arxiv.org/abs/2310.03951）
CoVe（https://cobusgreyling.medium.com/chain-of-verification-reduces-hallucination-in-llms-20af5ea67672）

与专注于有限任务的传统人工智能系统不同，LLM在训练过程中使用了大量的在线文本数据。当大模型语言生成功能应用在要求严格的应用程序时，LLM幻觉就变得非常令人担忧，例如：

一、幻觉缓解分类法

这项研究对LLM幻觉缓解技术进行了总结，分类为：梯度方法和非梯度方法。

梯度方法包括复杂和不透明的解码策略、知识图谱、微调策略等。

非梯度方法包括RAG、自我优化和Prompt微调。

值得注意的是，RAG方法分为四个部分；

Prompt工程缓解幻觉的原理在于定义：

预防幻觉的最佳方法不是单一的方法，需要综合多种方法。

缓减幻觉需要考虑以下因素：

[1] https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/321718