当前位置:   article > 正文

谷歌发布史上最强开源大模型Gemma,性能超Llama-2,笔记本也能跑

gemma模型支持中文吗

这两天 AI 界真是超级热闹,前有 Open AI 扔出 Sora 炸弹,如今 Google 在没有任何预告的情况下开源了全新大模型 Gemma。

985234f5cbb5aa64a9889c88bbccba85.png

此次发布的 Gemma 相比自家的 Gemini 更加轻量级,模型权重也一并开源。不仅可以在笔记本电脑上运行,而且还免费可商用,支持中文。看来很多创业公司已经开始两眼发光了。

还不知道 Gemma 是啥的,可以跟着我们来了解一下。

Gemma 是一个轻量级、最先进的开源大模型,采用与创建 Gemini 模型相同的研究和技术构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发,灵感来自双子座,拉丁语 gemma,意思是“宝石”。除了模型权重外,谷歌还发布了一些工具,以支持开发人员创新、促进协作并指导负责任地使用 Gemma 模型。

目前 Gemma 在全球范围内可用。以下是有关 Gemma 的一些要点:

  • 两种尺寸的模型权重:Gemma 2B 和 Gemma 7B。每种尺寸都带有预训练和指令微调的版本。

  • 一个生成式人工智能工具包,为使用 Gemma 创建更安全的 AI 应用程序提供了指导和必要工具。

  • 通过原生 Keras 3.0 为所有主要框架(JAX、PyTorch 和 TensorFlow)提供推理和监督微调 (SFT) 的工具链。

  • 准备好现成可用的 Colab 和 Kaggle 笔记本电脑,以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成,使 Gemma 入门变得容易。

  • 经过预训练和指令调整的 Gemma 模型可以在笔记本电脑、工作站或 Google Cloud 上运行,并可以轻松部署到 Vertex AI 和 Google Kubernetes Engine (GKE) 上。

  • 跨多个人工智能硬件平台进行优化确保行业领先的性能,包括 NVIDIA GPU 和 Google Cloud TPU。

  • 使用条款允许负责任的商业使用和传播。

Gemini 是目前市场上最大、功能最强的人工智能模型,而 Gemma 与 Gemini 之间是共享技术和基础设施组件的。这也使得 Gemma 2B 和 7B 能够在其规模上比其他开放模型的性能更佳。

Gemma 更加轻量级,可以直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是,Gemma 在 18 个关键基准测试中,已经明显超越了当前的主流模型 Llama-2 以及 Mistral。

ef315ec63104b2c442097fad9bae3ff2.png

特别是在数学、科学和编码相关的任务中, Gemma 表现突出。

看来前段时间被 Sora 抢走的热点,这次谷歌势必要抢回来了。

5f9a453ccfdec8aca949ad0e005f921d.png

就连 Google 人工智能研究员、Keras 作者 François Chollet 都说:“最强开源大模型的位置现在易主了。”

de520da2ea92a8a0544475e8b5f99abd.png

不少用户已经开始安装使用了。

8e37ba29d8e57725b674744fb65d5ece.png

发布当天短短几个小时,在 Hugging Face 上,Gemma 的 2B 和 7B 模型已经双双登顶。

a13ed5fc657da54a23163374d4872f68.jpeg

全民 AI 时代真的要来了吗?

面对如此卷的 AI 界,作为普通人还是要扎实基础,不断更新技能,为未来做好准备!

大模型底层知识储备

06f9c5bff53422577e2e1187f3749807.png

《Python深度学习(第2版)》

[美] 弗朗索瓦·肖莱 | 著作
张亮 | 译

本书由深度学习框架 Keras 之父弗朗索瓦·肖莱执笔,通过直观的解释和丰富的示例帮助你构建深度学习知识体系。作者避免使用数学符号,转而采用 Python 代码来解释深度学习的核心思想,包括 Transformer 架构的原理和示例。

7a6dcede9ebf781f23bb84120affee3e.png

《深度学习入门:基于Python的理论与实现》

斋藤康毅 | 著

陆宇杰 | 译

本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用 Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。

bf7157192dd85e6981b616a0ff803873.jpeg

《BERT基础教程》

苏达哈尔桑·拉维昌迪兰 | 著

周参 | 译

详细讲解十余种 BERT 变体的原理,本书聚焦谷歌公司开发的 BERT 自然语言处理模型,由浅入深地介绍了 BERT 的工作原理、BERT 的各种变体及其应用,书中用简单的文字清晰阐释 BERT 背后的复杂原理,让你轻松上手 NLP 领域的里程碑式模型。

其他大模型类图书

新书上市

c7ed2a2c5b1559e4e03c1457cad6c9b4.png

《大模型应用开发极简入门:基于GPT-4和ChatGPT》

[比] 奥利维耶·卡埃朗,[法] 玛丽–艾丽斯·布莱特 | 著

何文斯|译

本书为大模型应用开发极简入门手册,为初学者提供了一份清晰、全面的“最小可用知识”,带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。通过本书,你不仅可以学会如何构建文本生成、问答和内容摘要等初阶大模型应用,还能了解到提示工程、模型微调、插件、LangChain 等高阶实践技术。书中提供了简单易学的示例,帮你理解并应用在自己的项目中。此外,书后还提供了一份术语表,方便你随时参考。

6045cf6d90065bac2f48bede8d27d961.png

《这就是ChatGPT》

[美] 斯蒂芬·沃尔弗拉姆|著

WOLFRAM传媒汉化小组|译

OpenAI CEO,ChatGPT 之父山姆·阿尔特曼推荐,国内首部由世界顶级 AI 学者、科学和技术领域重要的革新者、“第一个真正实用的人工智能”搜索引擎 WolframAlpha 发明人斯蒂芬·沃尔弗拉姆对 ChatGPT 最本质的原理的解释的权威之作!

bcdba620a86a7c33a5193a671f7d87c9.jpeg

《ChatGPT高效提问:prompt技巧大揭秘》

李世明,代旋,张涛 | 著

本书以通俗易懂的语言,详细介绍了如何编写高质量的提示,引导 ChatGPT 输出优质答案,满足各种信息需求。书中包含详细解释和丰富示例,旨在帮助读者掌握利用 ChatGPT 解决各种问题的实用技能。

全书内容分为 6 章,其中前 3 章为基础介绍,后 3 章为具体用法和实战。其中包含 13 个 prompt 常见用法,8 个  prompt 高阶用法,13 个应用场景,提供丰富的实践案例,另外还有 100 个优秀的  prompt 示例可供参考。

0142df22c18addafeeb072f1bad1b8bf.jpeg

《利用ChatGPT进行数据分析》

张俊红|著

10 万册畅销书作者,根据 ChatGPT 在数据分析各个阶段的应用情况,按照数据分析师的职业发展路径展开,带你快速上手高效运用 ChatGPT 进行数据分析。

6b8cb5b5c1609213e4901a264666112b.jpeg

《ChatGPT:人类新纪元》

马占凯 | 著

“搜狗输入法之父”、美团光年 AGI 布道师马占凯新作。本书用生动浅显的语言,用鲜活的故事,讲述 ChatGPT 前世今生、AI 发展史,获得罗永浩、梁宁、戴雨森、王建硕、王玥等大咖倾情推荐。附赠中国 AGI 全景图、ChatGPT 全景图拉页,让你对 ChatGPT 及 AGI 相关产业的发展一目了然。

841913452319a11fd3c6d1f48c9a74b3.png

《ChatGPT从入门到精通》

黄豆奶爸 | 著

ChatGPT 超牛应用书,涉及 20 多个场景,涵盖高效办公+打造 IP+副业赚钱+新知学习+生活质量提升,粥左罗、肖厂长、孙圈圈、易仁永澄、芷蓝等联合推荐。本书旨在帮助读者了解 ChatGPT 和它背后的技术原理,掌握使用它的方法,并了解它的潜在应用和影响。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/700622
推荐阅读
相关标签
  

闽ICP备14008679号