2023 AI 的一年

作者：2023面试高手 | 2024-02-28 21:11:14

踩

2023 AI 的一年

2023：AI 的一年

2023 年是 AI 领域的关键年份，我们在此聚焦今年对该行业未来发展具有重大影响的主要事件。

AI 的进展

在今年的 AI 进展方面，重点在于改善现有技术，而非引入类似于去年的 ChatGPT 或图像生成器那样的革命性创新。虽然没有令人震撼的效果，且真正的通用人工智能（AGI）尚未实现，但今年标志着从之前的重大突破向更强大的未来过渡的中间阶段。为了展示这种发展趋势，我们制作了一个视觉时间线，强调了今年在 AI 领域最为显著的进展：
2023: AI 的一年

2023: AI 的一年

图像生成

Adobe Firefly: Adobe 的Firefly 和 Generative Fill 推动了多样化视觉内容的创作，如插画、艺术构思和照片编辑。集成到 Photoshop 中的 Adobe Firefly 使 AI 技术普及化，让更多用户能够轻松使用。其发布的文本效果功能也是一个重要进展，它允许用户给文字和短语添加风格或纹理。
Midjourney: Midjourney 的 V.5 模型在图像生成领域达成了重要里程碑，展现了更高的效率、连贯性和分辨率。它的最新 alpha 版本，Midjourney V.6，进一步增强了功能，比如更精准地响应用户输入（prompt）、提高了模型的知识水平和简易的文本绘制能力。
DALL·E 3: 基于 ChatGPT 的 DALL·E 3 简化了图像生成过程，避免了复杂的用户输入（prompt）设置。此外，ChatGPT 还推出了一项功能，帮助用户优化输入内容，并根据反馈调整图像。
Shutterstock.AI: 知名库存图片平台 Shutterstock.AI 加入了 AI 功能，使用户能将输入内容转换成可授权的图像。Shutterstock 在推动伦理 AI 方面迈出了重要一步，对贡献的艺术家给予认可和奖励。

文本到图像算法的演变，2007 对比 2023

视频生成

Stability AI： Stability AI 推出了 Stable Video Diffusion，这是一个具有里程碑意义的视频生成（generative video）模型，可在 GitHub 上开源访问。类似于 AI 图像生成的趋势，Stable Video Diffusion 模型很可能在 AI 生成视频领域发挥核心作用。
HeyGen： 这家 AI 创业公司推出了一款用于语音克隆的工具，能够调整视频中的唇部运动并进行语言翻译。
Runway Gen-2： Runway 发布了 Gen-2 模型，使用户仅需通过文本提示、图片或其他视频即可轻松生成完整视频。下面的例子就是一种展示。
Pika 和 Pika 1.0： 在首次发布时，Pika 吸引了超过五十万用户，每周生成数百万视频。在 Pika 1.0 中，升级后的 AI 模型使用户能够以多种风格（包括 3D 动画、动漫、卡通和电影）创作和编辑视频。
Meta 的像素编解码头像（PiCA）： Meta 的 Pixel Codec Avatars（PiCA）模型为视频中的 3D 人脸提供了更加逼真的远程传输体验。

文本生成

Bard 和 Gemini: 谷歌的 Bard 为聊天机器人注入了仿人类的情感和情绪。Bard 聊天机器人采用多模态数据集训练，而谷歌的 Gemini 以“最有能力”的 AI 模型身份崭露头角，成为与 OpenAI 的 ChatGPT 齐名的竞争者。
Grok: 埃隆·马斯克的创业公司 xAI 展现了其对 AI 发展的承诺，并有可能与 OpenAI 竞争。他们推出了“Grok” —— 一款具备幽默感、反叛特质，并能通过
声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/2023面试高手/article/detail/161795