赞
踩
数据飞轮,是今年大模型带火的一个典型词汇,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。简单说:好的产品 -> 更多的用户数据 -> 更好的模型质量 -> 更好的产品就进入了一个正向循环。一旦我们搭建起了这样的数据飞轮,就能在竞争中和对手拉开距离。
具体可参考:反思大模型公司的数据飞轮【2023Q4】 - 知乎
核心观点:
Q1:低垂的数据飞轮是什么意思?
现在不少人把数据飞轮仅作一个容易实现的狭义理解,也就是随着数据的增加,业务“自然”地就会有正反馈效应。例如:平台上的数据内容越多,就越能吸引更多的用户,而更多的用户又能以某些方式导致更多的内容出现在平台上。这个过程不需要平台做非常困难的数据挖掘或者持续的智能化升级,以下把这种数据飞轮称为“低垂的数据飞轮”。
Q2:大模型公司有数据飞轮么?是低垂的数据飞轮么?
很难想象说大模型公司没有数据飞轮效应,毕竟数据飞轮的定义过于宽泛,“数据变多了对于大模型公司没有任何作用”似乎不可能。
大模型公司的数据飞轮是低垂的数据飞轮么?大家一度认为“是的”,但现在大家则对此判断有分歧。大模型训练的数据清洗、数据增强工作被认为越来越重要,现在缺的并不是数据,而是“清洗过的数据”。单纯的新增大量低质量的数据不能说完全没有提升,但边际收益已经很低。即大模型公司不具有“低垂的数据飞轮”。
Midjourney是一款AI绘画工具,在Midjourney里面,简单到只要打几个字,就可以出来质量非常高的照片。
Midjourney产品设计:以用户社区作为入门教程、给用户即时反馈以及搭建数据飞轮以迭代模型,值得当前的AI应用构建借鉴和参考。
很多人都觉得Midjourney要比开源的Stable Diffusion好上不少,这背后有一个很重要的因素,就是它拥有更多高质量的标注数据。你可能要问了,Midjourney 只有不到 20 个人的团队,哪里来的资源去标注数据呢?答案就在 Midjourney 的产品设计流程里。
当前的AI内容生成类型的产品,普遍存在的一个问题?用户其实不知道该怎么玩这个产品?这个“不知道怎么玩儿”,不是说不知道怎么生成一张图片,而是说不知道什么样的提示语值得一试,可以画出什么样的场景。因为大部分人和你我一样,不太懂得绘画,也缺少一些想象力。这样,很容易随便画了两三张图片之后,就放弃使用 Midjourney 这样的产品了。
下面是Midjourney的几点值得参考的几点设计:
设计1:默认进入某一个新用户聊天群,可以看到其他用户不用的使用场景。这样就可以简单的复制粘贴提示语,然后修改几个单词,就可以复刻其他人相同风格的画作了。(老玩家也有对应的方式)
设计2:提供优秀的实践案例,通过“共享”用户创建的内容这样的方式,Midjourney 很容易地让整个社区成为了教会新用户使用产品的通道。而不需要自己费劲费力地去写教程,或者提供大量的新手引导功能。ChatGPT缺少这样的能力,于是就有了 ShareGPT、FlowGPT 这样分享 ChatGPT 对话内容以及特定、有趣的提示语网站了。
设计3:面对响应速度慢问题(硬件和计算瓶颈),尽可能让用户能在等待过程中可以看到这个任务是有进展的,也就是说图片不是一下子从0到100展现出来,而是逐步展现,如下两张图表示从进度从31%->62%的加载过程,减少用户的等待焦虑。和ChatGPT流式输出的效果是类似的,图片或视频的处理可能会更复杂。
设计4:Midjourney针对用户的输入,并不是每次只生成一张图片,而是生成了四张不同的图片。因为Diffusion算法生成的图片可控性性比较差,一次性拿到用户满意的图片概率比较低。一次性提供四张图片,让用户可以从四张里面挑一张,显然成功率就高多了。
搭建数据飞轮,快速迭代模型
Midjourney拥有更多高质量的标注数据,而这些数据绝大部分来自用户的标注或反馈数据。比如每个生成的图片下面有个Favourite按钮(代表喜欢和收藏),用户点击这个按钮的时候。Midjourney的团队就获得了一个由用户标注好的优质图片数据,也就是用户输入的提示词和对应的配对组合。
想象是美好的,实际用户主动点击Favourite按钮的会比较少,毕竟不是朋友圈类型的社交产品。Midjourney其实还有一些“隐形”的操作,也帮助用户标注了图片质量的好坏。
Midjourney 对于任何一个提示语,都会生成四张图片。除了直接从四张图片里面选一张放大之外,你还可以有另外两个选择。第一个是你可能对四张图片都不满意,那么你可以直接点击图片下面的“刷新”按钮,重新生成四张图片。或者,你对其中一张图片的整体观感还是不错的,但是还不够满意。你同样可以点击四格图下方的 V1-V4 按钮中的一个,以四格图里面的一张为基础,再生成 4 张相似的图片。而对于已经放大了的高清大图,用户同样可以点击 Make Variation 的按钮,来重新生成 4 张图片,再让用户选择。这两个动作里,用户尽管没有标记说哪一张图片是好的。但是其实已经告诉了我们,哪些图片他并不喜欢,以及 4 张图片里哪一张更接近他心目中理想的图片。
而 Midjourney 就可以根据用户前后的一系列操作日志,来筛选出那些用户最终选择的图片。如果用户做了大量刷新重新生成或者生成变体的操作,并且最后选定了一张图片放大,那么这张图片大概率是一张用户满意的高清大图,我们不需要依赖用户点击 Favorite 按钮这一动作。
这样的“隐式”反馈,在搜索、推荐等应用场景下很常见,比如在搜索场景,用户输入了搜索词却没有点击任何链接又重新输入了新的搜索词,那么大概率表示用户对搜索结果不满意。在短视频的推荐里面,尽管用户没有点赞或收藏,但是用户看完了整个视频,大概率表示用户对视频是感兴趣的。
对于大模型AIGC应用,这样“隐式”反馈信息的使用也非常重要。用户反馈越多,数据的质量就越高,高质量的数据,能让我们训练出更好的模型,而更好的模型,就意味着产品能够生成更高质量的内容,吸引更多的用户。这样,好的产品 -> 更多的用户数据 -> 更好的模型质量 -> 更好的产品就进入了一个正向循环。一旦我们搭建起了这样的数据飞轮,就能在竞争中和对手拉开距离。
用户社区、及时反馈以及建立数据飞轮是 AIGC 类应用必不可少的组成部分。
数据飞轮,是今年大模型带火的一个典型词汇,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。今年初,数据飞轮也曾一度被视为 OpenAI 最重要的先发优势。
问题1:「用户都看重数据资产,不愿意把数据拿出来,模型厂商帮助客户训好模型,做本地部署,做完了『净身出户』,数据飞轮很难建立起来」
火山引擎总裁谭待观点:
大模型的数据飞轮问题首先要合规,其次,很多企业愿意与模型厂商共创,从而可以让大模型厂商的大模型。
真正有比较好的 AI 原生应用出来,可能要等到底座模型本身至少具备GPT3.5+以上水平。
问题2:怎么理解「以消费为核心」的数据驱动?(以终为始)
火山引擎总裁谭待观点:回到最大的根本,做这件事情,还是希望把目标定清楚,最后其实是以数据消费为目标来做这个事情。跟过去五六年业界讲的数据中台的概念相比,这是一个更大的升级,而且是更有效解决企业数据产生价值的问题。
否则,很多企业投入大量的资源,建完之后有数据,但是没有利用起来,本质就是没有想清楚最终应该围绕什么来做这件事情。以前我们做建设的时候,目标是有偏差的,比如我建一个中台其实不是目标,是实现数据驱动的一个手段。
所以我们提出了数据消费、数据飞轮这样的逻辑。企业建设数据时,应该把数据消费作为目标,比如峰会讲的两个 80%:一是 80% 的企业员工能够用到,二是能覆盖到 80% 的分析场景。
数据飞轮是基于字节跳动十余年数据驱动实践经验提炼的企业数智化升级新范式,数据飞轮以数据消费为核心驱动,能够帮助企业数据流充分融入业务流,实现数据资产和业务应用相互促进飞轮效应,从而激发员工创造力,增强业务发展动力,提升组织生命力”。
部分观点:
通过对大模型能力的应用,DataLeap-找数助手可以帮助汽车企业员在取得授权的条件下,通过自然语言问答就能在数据库中找到对应的数据;而DataLeap-开发助手则可以帮助员工通过自然语言问答的形式,自动生成代码或者修复优化代码,进一步降低数据开发门槛。
在使用场景更广泛的数据分析方面,DataWind-分析助手支持汽车企业员工仅用自然语言对话,就能对数据进行多维度交叉分析和多种形式呈现,比如针对实时性较强的跨地域整车销量统计,销售岗位的员工只需在DataWInd-分析助手对话框中输入想要获取的数据,而无需再等待数据开发、数据分析等跨部门需求响应排期,即可获取对应数据,省时省力。(非技术人员可以快速实现需求满足)
参考:
《飞轮效应》图书:吉姆・柯林斯
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。