当前位置:   article > 正文

2023 AI 的一年

2023 AI 的一年

2023:AI 的一年

2023 年是 AI 领域的关键年份,我们在此聚焦今年对该行业未来发展具有重大影响的主要事件。

AI 的进展

在今年的 AI 进展方面,重点在于改善现有技术,而非引入类似于去年的 ChatGPT 或图像生成器那样的革命性创新。虽然没有令人震撼的效果,且真正的通用人工智能(AGI)尚未实现,但今年标志着从之前的重大突破向更强大的未来过渡的中间阶段。为了展示这种发展趋势,我们制作了一个视觉时间线,强调了今年在 AI 领域最为显著的进展:
2023: AI 的一年

2023: AI 的一年

图像生成

  • Adobe Firefly: Adobe 的FireflyGenerative Fill 推动了多样化视觉内容的创作,如插画、艺术构思和照片编辑。集成到 Photoshop 中的 Adobe Firefly 使 AI 技术普及化,让更多用户能够轻松使用。其发布的 文本效果功能 也是一个重要进展,它允许用户给文字和短语添加风格或纹理。
  • Midjourney: Midjourney 的 V.5 模型 在图像生成领域达成了重要里程碑,展现了更高的效率、连贯性和分辨率。它的最新 alpha 版本,Midjourney V.6,进一步增强了功能,比如更精准地响应用户输入(prompt)、提高了模型的知识水平和简易的文本绘制能力。
  • DALL·E 3: 基于 ChatGPT 的 DALL·E 3 简化了图像生成过程,避免了复杂的用户输入(prompt)设置。此外,ChatGPT 还推出了一项功能,帮助用户优化输入内容,并根据反馈调整图像。
  • Shutterstock.AI: 知名库存图片平台 Shutterstock.AI 加入了 AI 功能,使用户能将输入内容转换成可授权的图像。Shutterstock 在推动伦理 AI 方面迈出了重要一步,对贡献的艺术家给予认可和奖励。

文本到图像算法的演变,2007 对比 2023

文本到图像算法的演变,2007 对比 2023

视频生成

  • Stability AI: Stability AI 推出了 Stable Video Diffusion,这是一个具有里程碑意义的视频生成(generative video)模型,可在 GitHub 上开源访问。类似于 AI 图像生成的趋势,Stable Video Diffusion 模型很可能在 AI 生成视频领域发挥核心作用。
  • HeyGen: 这家 AI 创业公司推出了 一款用于语音克隆的工具,能够调整视频中的唇部运动并进行语言翻译。
  • Runway Gen-2: Runway 发布了 Gen-2 模型,使用户仅需通过文本提示、图片或其他视频即可轻松生成完整视频。下面的例子就是一种展示。
  • Pika 和 Pika 1.0: 在首次发布时,Pika 吸引了超过五十万用户,每周生成数百万视频。在 Pika 1.0 中,升级后的 AI 模型使用户能够以多种风格(包括 3D 动画、动漫、卡通和电影)创作和编辑视频。
  • Meta 的像素编解码头像(PiCA): Meta 的 Pixel Codec Avatars(PiCA)模型为视频中的 3D 人脸提供了更加逼真的远程传输体验。

文本生成

  • Bard 和 Gemini: 谷歌的 Bard 为聊天机器人注入了仿人类的情感和情绪。Bard 聊天机器人采用多模态数据集训练,而谷歌的 Gemini 以“最有能力”的 AI 模型身份崭露头角,成为与 OpenAI 的 ChatGPT 齐名的竞争者。

  • Grok: 埃隆·马斯克的创业公司 xAI 展现了其对 AI 发展的承诺,并有可能与 OpenAI 竞争。他们推出了“Grok” —— 一款具备幽默感、反叛特质,并能通过

    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/161795
推荐阅读
相关标签