搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小桥流水78
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
yum makecache报错:Metadata file does not match checksum
2
如何学习Python数据分析,最全路径图送给你(100天Get新技能)_python数据分析学习路线
3
信息化对决策的支撑_信息对决策的支持表现在哪些方面
4
淘客返利系统:揭秘技术背后的实现方案
5
GPT背后原理详解:从T5到GPT-4,国内20余位顶级大牛联合撰写
6
最强整理Python学习路线图(内含大纲+视频+工具+书籍+面试)_python学习路径
7
MyBatis-Plus 条件构造器与多表关联查询_mybatisplus条件构造器多表查询
8
Hadoop+Spark大数据技术(自命题试卷测试)_大数据技术试卷
9
pygame 实现俄罗斯方块小游戏_pygame俄罗斯方块 存放方块儿
10
oracle循环语句大全,oracle循环语句小结
当前位置:
article
> 正文
大模型面试题总结_大模型测试问题
作者:小桥流水78 | 2024-07-25 05:20:42
赞
踩
大模型测试问题
文章目录
一、大模型(LLMs)基础面
二、大模型(LLMs)进阶面
三、大模型(LLMs)微调面
四、大模型(LLMs)langchain面
1. 基于LLM+向量库的文档对话 基础面
2. 基于LLM+向量库的文档对话 优化面
3. LangChain的概念面试问题
4.LangChain的一些模块提问
5.LangChain的业务提问
6.LangChain的问题解决
五、LoRA、QLoRA、AdaLoRA篇
六、Fine tune
1)基础概念
2)为什么需要 P-tuning v2?
3)为什么需要 P-tuning?
4)为什么需要 指示微调(Prompt-tuning)?
5)为什么需要 前缀微调(Prefix-tuning)?
6)适配器微调(Adapter-tuning)
七、大模型(LLMs)参数高效微调(PEFT) 面
八、大模型(LLMs)推理面
九、大模型(LLMs)评测面
十、大模型(LLMs)强化学习面
十一、大模型(LLMs)训练集面
十二、LLMs 位置编码篇
十三、简单介绍一下 SentencePiece 思路?
十四、Layer Normalization 篇
十五、LLMs 激活函数篇
十六、一些面试问题提问
1)为什么会出现 LLMs 复读机问题?
2)llama 输入句子长度理论上可以无限长吗?
3)什么情况用Bert模型,什么情况用LLaMA、ChatGLM类大模型,咋选?
4)如何让大模型处理更长的文本?
十七、面试高频点
十九、其他面试问题
二十、题外音(社招来源)
一、大模型(LLMs)基础面
目前 主流的开源模型体系 有哪些?
prefix LM 和 causal LM 区别是什么?
涌现能力是啥原因?
大模型LLM的架构介绍?
二、大模型(LLMs)进阶面
llama 输入句子长度理论上可以无限长吗?
什么是 LLMs 复读机问题?
为什么会出现 LLMs 复读机问题?
如何缓解 LLMs 复读机问题?
LLMs 复读机问题
llama 系列问题
什么情况用Bert模型,什么情况用LLaMA、ChatGLM类大模型,咋选?
各个专业领域是否需要各自的大模型来服务?
如何让大模型处理更长的文本?
三、大模型(LLMs)微调面
如果想要在某个模型基础上做全参数微调,究竟需要多少显存?
为什么SFT之后感觉LLM傻了?
SFT 指令微调数据 如何构建?
领域模型Continue PreTrain 数据选取?
领域数据训练后,通用能力往往会有所下降,如何缓解模型遗忘通用能力?
领域模型Continue PreTrain ,如何 让模型在预训练过程中就学习到更多的知识?
进行SFT操作的时候,基座模型选用Chat还是Base?
领域模型微调 指令&数据输入格式 要求?
领域模型微调 领域评测集 构建?
领域模型词表扩增是不是有必要的?
如何训练自己的大模型?
训练中文大模型有啥经验?
指令微调的好处?
预训练和微调哪个阶段注入知识的?
想让模型学习某个领域或行业的知识,是应该预训练还是应该微调?
多轮对话任务如何微调模型?
微调后的模型出现能力劣化,灾难性遗忘是怎么回事?
微调模型需要多大显存?
大模型LLM进行SFT操作的时候在学习什么?
预训练和SFT操作有什么不同
样本量规模增大,训练出现OOM错
大模型LLM进行SFT 如何对样本进行优化?
模型参数迭代实验
四、大模型(LLMs)langchain面
1. 基于LLM+向量库的文档对话 基础面
LLMs 存在模型幻觉问题,请问如何处理?
基于LLM+向量库的文档对话 思路是怎么样?
基于LLM+向量库的文档对话 核心技术是什么?
基于LLM+向量库的文档对话 prompt 模板 如何构建?
2. 基于LLM+向量库的文档对话 优化面
痛点1:文档切分粒度不好把控,既担心噪声太多又担心语义信息丢失
痛点2:在基于垂直领域 表现不佳
痛点3:langchain 内置 问答分句效果不佳问题
痛点4:如何 尽可能召回与query相关的Document 问题
痛点5:如何让LLM基于query和context得到高质量的response
3. LangChain的概念面试问题
什么是 LangChain?
LangChain 包含哪些 核心概念?
什么是 LangChain Agent?
如何使用 LangChain ?
LangChain 支持哪些功能?
什么是 LangChain model?
LangChain 包含哪些特点?
LangChain 如何使用?
LangChain 存在哪些问题及方法方案?
LangChain 替代方案?
4.LangChain的一些模块提问
LangChain 中 Components and Chains 是什么?
LangChain 中 Prompt Templates and Values 是什么?
LangChain 中 Example Selectors 是什么?
LangChain 中 Output Parsers 是什么?
LangChain 中 Indexes and Retrievers 是什么?
LangChain 中 Chat Message History 是什么?
LangChain 中 Agents and Toolkits 是什么?
5.LangChain的业务提问
LangChain 如何调用 LLMs 生成回复?
LangChain 如何修改 提示模板?
LangChain 如何链接多个组件处理一个特定的下游任务?
LangChain 如何Embedding & vector store?
6.LangChain的问题解决
LangChain 低效的令牌使用问题
LangChain 文档的问题
LangChain 太多概念容易混淆,过多的“
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小桥流水78/article/detail/878561
推荐阅读
article
“
HELLO
WORLD
” 解题思路
_
上传
文件
hello
world
题目...
Hello!大家好。今天给大家带来一道简单的编程题。解题思路:先新建一个字符串变量,然后将要输出的内容“
HELLO
WO...
赞
踩
article
基于
网关
的
灰度
发布
_
灰度
应用断言...
本文介绍了如何
基于
Spring Cloud Zuul和Eureka实现
灰度
发布
,详细阐述了
灰度
发布
的
定义、作用和步骤,并...
赞
踩
article
MongoDB
数据
库(10亿条
数据
)清理策略: 自动化
过期
数据
删除
实战_
mongodb
自动
删除
过期数...
根据公司业务发展积累,在众多应用场景中,如日志记录、临时缓存、会话管理等,
数据
往往具有时效性,超过一定时间后便不再有用。...
赞
踩
article
词云
制作没那么难
,
Python
10
行
代码
就实现了!_
词云
算法_
词云
制作
代码
...
词云
制作
代码
代码
块 '''遇到问题没人解答?小编创建了...
赞
踩
article
如何
用一篇
文章生成
知识
图谱
_
如何
根据
文本构建
知识
图谱
...
https://www.zhihu.com/question/355473263_
如何
根据
文本构建
知识
图谱
如何
根据
文本构...
赞
踩
article
在
spyder
中
使用
arcgis
pro
的包...
历时2天终于搞定了目标:在anconda
中
新建一个arcpyPro环境,配置
arcgis
pro
3.0
中
的arcpy。在s...
赞
踩
article
超全总结!
大
模型
算法
面试
指南(
含答案
)
_
大
模型
面试
...
算法
在
大
模型
面试
中扮演着至关重要的角色。它不仅测试了候选人的基础技能和问题解决能力,还反映了他们的逻辑思维、推理能力、创...
赞
踩
article
国内
的
AI
大
模型
及其应用场景网址(非常详细)零基础入门到精通
,
收藏这一篇就够了
_
ai
大
模型
网站
...
国内
目前有多个重要
的
开源
大
模型
,
每个
模型
都有其独特
的
特点和用途。
_
ai
大
模型
网站
ai
大
模型
网站
...
赞
踩
article
SuperMap
GIS
基础
产品
FAQ
集锦(20240715)...
SuperMap
GIS
基础
产品
FAQ
集锦(20240715)
SuperMap
GIS
基础
产品
FAQ
集锦(2024071...
赞
踩
article
AI-
自然语言
处理-
文本
向
量化
_ai
向
量化
...
本文旨在深入探讨
自然语言
处理的基础——
文本
向
量化
。内容涵盖
文本
向
量化
的重要性,介绍了one-hot、TF-IDF、wor...
赞
踩
article
Mongodb
清
空集合
数据...
drop命令会把索引也删掉,某些时候只想清空数据,索引要保留.所以使用下面的方式清空>use db名称<'switche...
赞
踩
article
linux
第三天
作业
-
RHCSA
_黑马
程序员
linux
命令基础
第三天
作业
...
一.实验要求二.实验操作1.[root@localhost ~]# mkdir /ceshi[root@localhos...
赞
踩
article
深入探讨
开源
对话
系统
:
IntelliQ
的世界...
IntelliQ
是一个
开源
项目,它结合了最新的自然语言处理技术,致力于提高对话
系统
的性能。通过多轮对话管理,这个
系统
能够...
赞
踩
article
jenkins从入门到生产教程-基于
docker
安装
nexus
(六)_
error
pulling
i...
1、安装
nexus
1.1、从中央仓库获取
nexus
最新版本直接启动
docker
以后在安装
docker
的服务器上执行以下脚...
赞
踩
article
解决
git
:
'
subtree
' is not
a
git
comm
a
nd
. See '
git
--...
一、第一方法
git
clone https
:
//
git
hub.com/
git
/
git
.
git
cd
git
/contrib...
赞
踩
article
【正点原子
K210
连载】第七章
基于
CanMV
的
MicroPython
语法
开发
环境搭建 摘自【正点原...
1)实验平台:正点原子ATK-
DN
K210
开发
板2)平台购买地址https://detail.tmall.com/ite...
赞
踩
article
无人
零售
|
商品
图像
识别
之
实现目标
体分类
识别
的
基础阐释_商业场景
的
目标
识别
...
无人
零售
门店
的
出现加速了
商品
的
高效流通,提高了人们生活质量,也促进了社会
的
发展。现今社会人工成本日渐高昂,
商品
图像
的
自动...
赞
踩
article
全面解析
SnowNLP
:中文
文本处理
、
情感
分析
...
SnowNLP
是一个专门用于处理中文文本的 Python库。分词
情感
分析
关键词提取文本分类拼音转换繁体转简体词相似度计...
赞
踩
article
【洛谷
B2002
】
Hello
,
World
!(顺序结构)_洛谷
b2002hello
,
world
!...
编写一个能够输出的程序。HW。_洛谷
b2002hello
,
world
!洛谷
b2002hello
,
world
! ...
赞
踩
article
LeetCode
面试150——88
合并
两个
有序
数组
...
Leetcode面试经典150题第88题
合并
两个
有序
数组
LeetCode
面试150——88
合并
两个
有序
数组
...
赞
踩
相关标签
c++
spring cloud
java
过滤器
数据库
mongodb
自动化
python
算法
开发语言
arcgis
面试
职场和发展
人工智能
数据挖掘
机器学习
SuperMap
WebGIS
GIS
三维GIS
语言模型
开源软件
docker
jenkins