weixin_40725706

这个屌丝很懒，什么也没留下！

热门标签

【原创】AIGC之主流产品介绍_aigc产品

作者：weixin_40725706 | 2024-02-16 12:28:14

踩

aigc产品

AIGC是什么

AIGC - AI Generated Content （AI生成内容），对应我们的过去的主要是 UGC（User Generated Content）和 PGC（Professional user Generated Content）。

AIGC就是说所有输出内容是通过AI机器人来生成产出相关内容，主要区别是过去主要是普通用户和某一领域专业用户（人）生产内容，AIGC主要是依赖于人工智能（非人类）生成内容，这个就是AIGC的核心意思。

（版权认定：UGC和PGC是有版权概念的，版权归属于负责生成内容的人，AIGC目前美国法规认为是没有版权概念的，就是内容不属于调用的人，也不属于这个AI机器，所以没有版权归属这件事。）

AIGC可以生成什么内容

目前AIGC主要可以生成文本内容和图片内容（目前视频生成有一些产品，但是没有文本和图片生成这么成熟），所以我们主要集中在文本和图片的AIGC的介绍。

AIGC在文本内容方面，主要可以通过 Q&A （提问回答）得形式进行互动，能够按照人类想要的“提问”生产输出符合人类预期的内容。

一般我们可以把AI当做一个全知全能的“高级人类”，以“文本AIGC”来抡，你可以向它提出问题（Prompt），然后它做出相应回答。所有提问和回答都可以涉及到方方面面，包括不限于百科知识/创意文案/小说剧本/代码编程/翻译转换/论文编写/教育教学/指导建议/聊天陪伴等等等等场景不一而足，场景都需要你去想，可以理解它是一个拥有全地球知识的“百晓生”，什么都可以问它或者跟它交流。

比如我们用大名鼎鼎的 ChatGPT 来进行提问：

对于“图片AIGC”来说，你可能脑子里有无数创意，但是自己不会绘画，无法把脑子里的Idea变成实实在在的图片，那么，“图片AIGC”能够帮助你按照你脑子想要的东西，你告诉它，然后它能够帮助你通过图片绘画的形式给你画出来，让你一下子把自己的“创意”变成了图片现实。

比如我们用非常好用的“图片AIGC” 工具 Midjourney 来画画：

主流AIGC产品

目前AIGC主要是生成文字和图片，目前全球主流比较靠谱的AIGC产品主要是在国外。

文字AIGC产品

OpenAI ChatGPT/GPT-4: http://chat.openai.com

Google Bard：https://bard.google.com

Microsoft NewBing：必应

Baidu ERNIE Bot(文心一言)：文心一言

Github Copilot：GitHub Copilot · Your AI pair programmer · GitHub

图片AIGC产品

Midjourney：Midjourney

Stable diffusion：Stable Diffusion Online

OpenAI DALL.E：DALL·E

百度文心一格：文心一格 - AI艺术和创意辅助平台

视频AIGC产品

D-ID：D-ID Creative Reality Studio

Glia：GliaStudio | 用人工智能视频化你所有的故事

其中，比较靠谱的产品主要是 ChatGPT/GPT-4 和 Midjourney 两个产品是比较成熟可靠的。

文本AIGC产品的介绍

Bard 是Google开发的一个文本对话机器人，是建立在一个大型语言模型基础上的。它可以利用来自网络的信息提供比较新鲜高质量的回答，比如说，Bard可用来比较两部电影，还能根据冰箱里的食物安排午餐吃什么。按照Google官方说法，Bard采用5000亿个参数进行训练，因为是邀请制，还没有完整体验Bard的功能，按照相关信息看，Bard比较容易翻车。

ChatGPT/GPT-4 是OpenAI公司开发的对话机器人，ChatGPT是基于GPT-3.5上面的1750亿个参数进行训练的大语言模型，GPT-4是 ChatGPT 的升级版本，官方没有公开具体训练参数数量，但是肯定比 GPT-3.5要更多，传闻训练参数数量在 1750亿~100万亿之间，从数据来看是非常巨大的。

NewBing 是微软公司开发的在浏览器和Bing搜索引擎中集成的一个对话机器人，它整个底层模型主要是依赖于微软投资的OpenAI公司开发的 ChatGPT/GPT-4 模型为主，基本可以认为是 ChatGPT/GPT-4 在Bing中的另外一个展现版本。

ERNIE Bot（文心一言） 是百度开发的一个大语言模型，ERNIE是一个独立的语言模型（传闻是基于BERT模型进行升级的产品），目前迭代到了3.0版本，具备有千亿参数训练而成，可以支持文字AIGC和图片AIGC。

Github Copilot 是微软控股的 Github 公司开发的一个编程辅助AI工具，使用 GitHub Copilot 可以在软件开发工程中，通过机器学习算法来生成部分代码，可以在程序编辑器中获得整行代码或整个函数的代码建议，可以通过提供半自动完成的建议来帮助编写代码，提高了代码编写的效率和精确度。训练数据应该是整个 Github 平台上面托管的所有开源代码。

图像AIGC产品介绍

图像AIGC产品目前主流的主要有 DALL·E， Stable Diffusion 和 Midjourney等，文心一言也有对应产品，不过目前从网络风评来看会稍微效果有一定提升空间。

DALL-E 2 是OpenAI公司的产品，使用数以百万计的图片数据进行训练，其输出结果更加成熟，非常适合企业使用。当有两个以上的人物出现时，DALL-E 2产生的图像要比Midjourney或Stable Diffusion好得多。

Midjourney 是一个小众的工作室生成，是一个以其艺术风格闻名的工具。Midjourney使用其Discord机器人来发送以及接收对AI服务器的请求，几乎所有的事情都发生在Discord上。由此产生的图像很少看起来像照片，它似乎更像一幅画。

Stable Diffusion 是一个开源的模型，人人都可以使用。它对当代艺术图像有比较好的理解，可以产生充满细节的艺术作品。然而它需要对复杂的prompt进行解释。Stable Diffusion比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。

（看三者的大概区别，以为“生成花合雪景结合的图片”查看区别）

目前比较常见容易使用的主要是 Midjourney ，总体效果还是比较不错的。

AIGC使用前置性问题关注

对于所有AIGC产品来说，能够很好的学会 Prompt （提问/提示/描述问题需求）是非常重要的一件事，如果一个好的 Prompt 能够事半功倍，让AIGC机器人快速理解你的意图，然后顺利给出你想要的答案。

AIGC的准确性问题

文本类AIGC不能保证答案100%准确，它只会输出它认为最相关最可能得结果，所以使用的时候需要自己对结果进行检查交叉校验，防止出现不一定准确的结果错误引导。

（我们看ChatGPT一个回答错误的范例，实际答案是ABD）

所以对于结果最好是自己熟悉的领域，能够适当有基本对生成结果判断的能力。

AIGC中Prompt的语言选择问题

文本AIGC来说，比如ChatGPT，中文给它提问（Prompt）会获得不错的结果，因为它针对中文的训练语料采集的不错，所以相关结果还算不错，英文提问（Prompt）结果会更好。

对于图片AIGC来说，无论是国外的AIGC产品还是百度文心一言，如果使用中文的情况，可能会与你想要的结果会相差非常的大。

比如我想要图片AIGC帮我生成一个小女孩和小猫在一起的图片，我们看中英文不同 Prompt 生成的结果区别：

所以，如果是在图片AIGC的场景中，尽量采用英文进行描述，可以把中文翻译成为英文的Prompt 后然后进行提交生成。当然，如果真的要用好AIGC工具，生成优秀的Prompt是非常重要的事情，需要持续学习，所以需要在实践中增长编写Prompt的能力。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/93219