当前位置:   article > 正文

正在直播:微软正式发布Phi-3,预览其多模态小型语言模型Phi-3-vision_phi3 vision效果如何

phi3 vision效果如何

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

微软推出Phi-3轻量级模型家族,为开发者提供新工具

在首次宣布发布近一个月后,微软终于将Phi-3轻量级模型家族开放给开发者使用。Phi-3-medium、Phi-3-small和Phi-3-mini都已向开发者开放,其中Phi-3-mini已成为Azure AI的一部分。此外,微软还展示了一个名为Phi-3-vision的小型模型的多模态变体,拥有42亿参数。

Phi-3:为所有人设计的强大语言模型

由微软研究院开发的Phi-3是一款强大的30亿参数语言模型,旨在以显著较低的成本提供与更大模型相当的推理能力。Phi-3是微软在紧凑型语言模型领域的第四次迭代开发——Phi-1是在一年前开发的,随后是Phi-1.5和Phi-2。

随着开发者越来越倾向于在本地或设备上运行AI,寻求功能更强大且更小的选项成为趋势。除了Phi-3,市场上还有谷歌的Gemma 2和Hugging Face的Zephyr等选择。而微软并不仅仅开发了一个小模型,Phi-3提供了三种选项:Phi-3-mini拥有38亿参数,Phi-3-small有70亿参数,Phi-3-medium则有140亿参数。据微软介绍,这些模型在表现上与OpenAI的GPT-3.5相当,但形式更加轻量化。

Phi-3的公开发布恰逢AI PC的即将到来,开发者现在可以利用不同的Phi-3变体,将其AI应用带到笔记本电脑、移动设备和可穿戴设备上。

Phi-3-vision:多模态的强大模型

除了发布Phi-3,微软还推出了一款支持通用视觉推理任务以及图表、图形和表格推理的新模型变体,名为Phi-3-vision,拥有42亿参数。用户可以就某个图表提问,或使用开放式问题询问特定图像的信息。

顺便提一下,谷歌在上周的开发者大会上也推出了自己的轻量级多模态模型PaliGemma,提供类似的功能,但其参数为30亿,略小于微软的版本。

能够解释多种输入形式的AI对开发者来说非常有价值,如果有办法提供具有LLM性能但成本仅为其一小部分的模型,将大大促进其普及。

尽管Phi-3-vision已作为预览版发布,微软尚未透露其何时会正式公开发布。

结语

Phi-3轻量级模型家族的发布标志着微软在AI领域的又一重大进展,为开发者提供了更多的工具和选择,使其能够在各种设备上实现强大的AI功能。随着AI技术的不断发展,类似Phi-3这样的紧凑型模型将越来越重要,在保证性能的同时,降低成本和资源消耗。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/773718
推荐阅读
相关标签
  

闽ICP备14008679号