赞
踩
目的:
优点:它同时考虑了查询与存储文档之间的语义相似性和关键字匹配度;
文本分片:固定大小分块,内容感知分块,递归分块,专门分块(Markdown, html)
- 对用户query进行清洗和关键词抽取,由于用户query存在部分口语化的词,如停用词等,直接抽取用户中的关键词做召回是一个有效的方式。
:基本方法:检索与用户查询相关的上下文,然后将其与内存缓冲区中的聊天历史记录一起发送给LLM, 让LLM在生成下一个答案时了解先前上下文
:聊天历史记录和最后一条消息都
-基本方法:将所有获取的上下文(>相关阈值)与查询一起连接并立即提供给LLM。
-其他响应合成策略:涉及多个LLM调用,以细化检索到的上下文并生成更好的答案:
- 1. 通过将检索到的上下文逐块发送到LLM来迭代地细化答案
- 2. 总结检索到的上下文以适应提示
- 3. 同的上下文块生成多个答案,然后将它们连接或总结
https%3A//arxiv.org/pdf/2005.11401.pdf
https%3A//arxiv.org/abs/2312.10997
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。