当前位置:   article > 正文

精选30个大模型高频面试题_模型量化面试题

模型量化面试题

我精选30个大模型高频面试题,分享给大家

  1. 介绍一下postlayernorm和prelayernorm的区别
  2. 什么是思维链(CoT)提示?
  3. 你觉得什么样的任务或领域适合用思维链提示?
  4. 你了解ReAct吗,它有什么优点?
  5. 解释一下langchainAgent的概念
  6. langchain有哪些替代方案?
  7. langchaintoken计数有什么问题?如何解决?
  8. LLM预训练阶段有哪几个关键步骤?
  9. RLHF模型为什么会表现比SFT更好?
  10. 参数高效的微调(PEFT)有哪些方法?
  11. LORA微调相比于微调适配器或前缀微调有什么优势?
  12. 有了解过什么是稀疏微调吗?
  13. 训练后量化(PTQ)和量化感知训练(QAT)与什么区别?
  14. LLMs中,量化权重和量化激活的区别是什么?
  15. AWQ量化的步骤是什么?
  16. 介绍一下GPipe推理框架
  17. 矩阵乘法如何做张量并行?
  18. 请简述下PPO算法流程,它跟TRPO的区别是什么?
  19. 什么是检索增强生成(RAG)?
  20. 自前主流的中文向量模型有哪些?
  21. 为什么LLM的知识更新很困难?
  22. RAG和微调的区别是什么?
  23. 大模型一般评测方法及基准是什么?
  24. 什么是KVCache技米,它真体是如何实现的?
  25. DeepSpeed推理对算子融合做了哪些优化?
  26. 简述一下FlashAttention的原理
  27. MHA,GQA,MQA三种注意力机制的区别是什么?
  28. 请介绍一下微软的ZeRO优化器
  29. PagedAttention的原理是什么,解决了LLM中的什么问题?
  30. 什么是投机采样技术,请举例说明?

用通俗易懂方式讲解系列

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/909165
推荐阅读
相关标签
  

闽ICP备14008679号