赞
踩
你好,我是悦创。
北京时间6月11日凌晨1点,也就是几个小时之前,苹果公司召开了自己今年的开发者大会 WWDC,其中推出了堪称苹果十年来最大的一次版本更新——iOS18。当然,我敢这么说,主要也是因为他们之前的一些版本都过于小打小闹了,而这次他们几乎把能改的地方全改了。
另外,苹果也推出了“苹果智能”这个品牌,虽然中文听起来有点奇怪,但你只要看一眼英文单词就明白了“Apple Intelligence”,首字母缩写正好是AI。苹果这波真的是虽迟但到,重新定义了AI。
发布会持续了将近两个小时。前1个小时,苹果介绍了非常多边缘功能的迭代,例如变换壁纸颜色和改变锁屏手电筒图标这样的“美丽废物”功能,丝毫没有提及 AI。
就在我万分懊恼不应该熬夜的时候,苹果的 CEO 蒂姆·库克漫步在苹果园区的小路上,对着苹果手机镜头说:“苹果 AI 来了。”原来这才是本场发布会的重头戏。
接下来从文本生成、图像生成到 Siri 的重生,发布会介绍了非常多的 AI 使用场景。作为咱AI学习圈同学的 AI 学习委员,我跟大家分享一下我记录的五条笔记。
第一条,苹果 AI 的五大优势关键词,“强大,直观,集成,个性化和隐私保护”。这是苹果软件工程高级副总裁克雷格·费德里吉在发布会中反复强调的,他也是整场发布会出镜率最高的人。
这五大关键词听起来很抽象,我来根据我的理解一个个词给你拆解一下。
Power:“强大”指的是苹果最近几年在软硬件上的飞速发展,特别是芯片上的进步确实非常明显,而好的 AI 应用场景对设备的配置要求很高。在这一点上,苹果对自己的设备能力非常自信。
Intuitive:“直观”是指苹果的 AI 场景设计追求易用,无论是照片里的人脸识别,还是智能推荐,都力求用户可以轻松上手。说到这里,我突然反应过来,这场发布会的上半场虽然没有提及AI,但苹果已经悄悄在很多场景里融入了人工智能。例如一个非常小的细节,是计算器的计算能力迭代。如果在备忘录里,竖着手写几个数字,然后只是在数字下划一条横线,系统会自动调用计算器做加法计算。这个镜头虽然只有短短三秒钟,但是非常符合“直观”这个词的定义。
Integrated:“集成”这个好理解,就是苹果自己的生态紧密链接,从 iPhone 到 iPad 到 Mac 到苹果手表,不同设备间的用户体验一致。
Personal:“个性化”是克雷格所说的,跟其他大模型相比,苹果能带来什么样的体验升级。因为苹果更了解用户的行为和偏好,所以可以为每个人提供个性化的建议和服务。
Private:“隐私保护”是苹果在发布所有 AI 功能时都会强调的重点,他们反复说,苹果 AI 处理任务会直接在设备上进行,而不是把数据上传云端。哪怕是要运行更复杂的任务,他们也会提供私有云计算,来保证隐私。这确实能命中很多用户或者企业的痛点。
讲完苹果 AI 五大优势关键词,我记下的第二条笔记,就是 Siri 的重生了。
从这次发布会展示出来的 Siri 功能来说,称其为“重生”毫不夸张。Siri 虽然之前号称是人工智能助手,但是直到 2023 年,它能做的事情其实跟 2013 年也差不多。所以在很多地方,Siri 前面经常会被羞辱性地加上一个形容词,叫“智障的 Siri”,但是今天发布会所展示的 Siri 使用场景,还是让人非常动心的。
例如苹果用1分钟演示了一个完整使用 Siri 的场景。演示者先按右边的实体键,唤起了 Siri,这次新增了一个动画效果,整个屏幕边框开始闪烁,非常有赛博朋克风。然后她问 Siri 她妈妈的航班信息。Siri 就先从短信应用里找到妈妈发来的具体航班号,然后读取降落时间,紧接着从日程应用中查找她的行程安排,发现她有空闲时间,最后在地图应用中推送,从当前位置到机场接机的最佳行程路线,需要21分钟。整个过程非常丝滑。
这个场景简直就是我们所能想象的 AI 落地的最佳场景了。如果我上面这段场景描述,你还没太理解的话,咱们再举个例子。例如现在深夜了,你还在公司加班,这时你唤起 Siri,跟它说:“我饿了。”然后它可能先查查你的健身应用,发现你已经半年没健身了,所以对吃不吃碳水已经没有限制了。然后它就打开你的美团外卖,自动帮你点一个过去两个月你在公司加班最喜欢吃的黄焖鸡米饭,还帮你自动加上备注“店家快点儿,饿死了,不要放香菜”。等你吃到一半的时候,Siri 还会提醒你:“现在还不下班吗?末班地铁还有15分钟到站,你现在走到地铁站正好能赶上。”
当然这次公布的 Siri 的一些功能,主要还是调用苹果的一些原生应用的能力。不过他们也说了,接下来会逐步进行 API 的迭代,方便其他应用调取 Siri。我会关注这个的进展,期待可以在我们的应用里早日加入相关功能。比如直接唤起 Siri,问它:“我之前看过的一本书,里面写了乔布斯是怎么骂微软的,你帮我找出来。”然后 Siri 就可以从我在电子书的阅读记录或者过往的笔记里找到这个内容。再比如直接唤起 Siri,说:“帮我找找得到里关于人工智能与中小学教育相结合的书里,评分最高的那本,开始读。”
所以这次 Siri 的功能发布,会给一大批应用更多的尝试可能性。
第三条笔记是关于 AI 生成图像的功能。整场发布会涉及到 AI 和图像结合的功能点比较多,让我印象比较深的有两个。第一个是Genmoji,这个怎么理解呢?其实就是让 AI 帮你快速生成聊天表情包。并且因为苹果手机里有你和你朋友的太多照片,所以你可以用指令让 AI 直接帮你生成一张表情包。当然美中不足的是,这个功能目前只能在苹果手机的“消息”中使用。对大部分国内同学来说,“消息”这个应用主要是用来收验证码和广告信息的,所以不够刚需。
另一个功能是图片游乐场,其实就是你可以用你的手机直接输入 AI 指令,然后能生成三张图片。它的优势在于你可以直接导入手机的图片,使用流程比较顺滑。不过不得不吐槽的是,目前 AI 生成的图片质量看起来塑料感十足,拿着随便玩玩还可以,不堪大用。
第四条笔记是关于 AI 图像搜索功能的,这个功能在发布会上被 Siri 抢去了风头,时间非常短,但相信对很多苹果手机用户来说是刚需。因为每天拍了很多照片,找的时候却只能凭借模糊的记忆去寻找,效率非常低。而新的苹果 AI 会推出照片搜索,可以输入一些关键词进行精准搜索。例如在演示环节,输入一个和孩子钓鱼的关键词,系统马上就挑出了几十张爸爸和孩子在不同时期一起钓鱼的照片,并自动组了一个短视频。这对很多父母来说,简直是晒娃的绝佳工具,例如可以找出孩子每年的生日照片,生成一个祝福视频。
另外,还可以直接描述场景,搜索视频里的场景并进行精准的时间点定位,这个使用场景也比较有想象力,只不过不知道真实用起来的效果怎么样。
第五条笔记是关于 ChatGPT 的。在本次大会前,很多现场参加会议的人,都纷纷秀出他们拍到的 OpenAI CEO 奥尔特曼的照片,大家都预测苹果和 OpenAI 会有重磅合作。果然在发布会最后,苹果直接放出了大招,就是当本地模型解决不了问题的情况下,Siri 会询问用户,要不要去问问 ChatGPT。这个调用不需要用户注册 OpenAI,而且完全免费。当然,如果你之前已经是 ChatGPT 的用户,可以绑定自己的账户,方便保存一些个性化设置。
这个功能,如果我们用简单粗暴一点儿的方式理解,那就是苹果用 Siri 给 ChatGPT 套了一个壳,可以以非常方便顺滑的方式开启和 ChatGPT 的对话。对于用户来说,这当然是好消息,因为可以使用现阶段最强大的 AI 模型。
对 OpenAI 来说,跟苹果绑定在一起,这让他们在大模型的竞争中又多了一个重磅盟友。毕竟苹果设备的很多信息,是 ChatGPT 仅靠文字无法获得的。并且这也相当于苹果在用自己多年的品牌信用,对市场说:“OpenAI 这兄弟的 AI 能力比我强多了,所以用它没错的。” 通过这个合作,OpenAI 从用户到品牌到训练数据,包括从苹果那儿收取的费用都有了,简直赚翻了。
不过,留给国内苹果用户的一个悬念就是,下一代苹果手机进入国内,绑定的 AI 模型会是哪家。
这次苹果发布会的 AI 亮点内容我就介绍到这里。其实就发布会本身而言,也能学到很多。例如整个发布会的场景非常干净,特别是苹果 CEO 库克的两次出场,一次是自己站在办公楼顶楼,旁边是一片一片的太阳能板;一次是自己走在园区的小路上,并且都是用 iPhone 手机拍摄,用 Mac 剪辑。整个发布会的科技感远不如我参加的任何一场线下大会,但却能让人更加聚焦内容本身。我特意截了两张图放在文稿里,你看一下,是不是我们很多短视频的拍摄背景都比这个要复杂很多?
好,这就是我熬夜看完苹果发布会写下的五条笔记,希望对你有帮助。如果里面有某个场景触动你了,你也可以留言跟我聊聊,你最希望苹果 AI 帮你解决什么问题?
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。