当前位置:   article > 正文

大模型日报 2024-07-10

大模型日报 2024-07-10

大模型日报 2024-07-10

大模型资讯

  1. CVPR 最佳论文候选 | NeRF 新突破,用启发式引导分割去除瞬态干扰物,无需额外先验知识

    • 介绍 NeRF 研究中消除瞬态干扰物影响的新方法。
  2. 彻底改变语言模型:全新架构 TTT 超越 Transformer,ML 模型代替 RNN 隐藏状态

    • 全新大语言模型架构 TTT 有望代替 Transformer 模型。
  3. 没想到!AlphaZero 式树搜索也能用来增强大语言模型推理与训练

    • 介绍大语言模型树搜索训练增强框架 TSLLM。
  4. 鄂维南院士领衔新作:大模型不止有 RAG、参数存储,还有第 3 种记忆

    • 介绍新型语言模型 Memory3 及其优势。
  5. 第一次,语言的神经激活被定位到细胞级

    • 报道关于语言理解的神经元活动研究。
  6. 70 万人争先体验!视频生成新王者「可灵 AI」又双叒升级了

    • 快手旗下「可灵 AI」的升级及新功能。
  7. DeepMind 新方法:训练时间减少 13 倍,算力降低 90%

    • DeepMind 提出新训练方法提高效率。
  8. 深度解析 RAG 大模型知识冲突,清华西湖大学港中文联合发布

    • 分析 RAG 大模型的知识冲突问题。
  9. 人人可做提示工程师!Claude 上新:一键生成、测试和评估 prompt

    • Claude 工具助力生成和评估 prompt。
  10. 单一作者论文,谷歌提出百万专家 Mixture,超越密集前馈、稀疏 MoE

    • 谷歌提出参数高效的专家检索机制 PEER。
  11. WAIC 观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出

    • 介绍隐私计算技术的发展和标准体系建设。
  12. LeCun 转发,首个半导体设计开源大模型 SemiKong 问世,重塑芯片制造流程

    • 首个半导体开源大模型 SemiKong 有望改变行业。
  13. AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

    • AlphaFold 3 在预测生物分子复合物结构方面的进展。

大模型开源项目

  1. 首个半导体设计开源大模型 SemiKong 问世
    • 为半导体行业带来变革。

以上是为您生成的 2024 年 7 月 10 日的大模型日报。

本文由 mdnice 多平台发布

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/866350
推荐阅读
相关标签
  

闽ICP备14008679号