赞
踩
人工智能似乎已经渗透到现代生活的各个角落,从音乐和媒体到商业和生产力,甚至包括约会。其中涵盖的内容太多,以至于很难跟上 — 因此,请继续阅读,了解从最新的重大发展到必须了解的术语和公司,以便在这个快速变化的领域保持时效性。
首先,让我们确保我们都在同一个起点上:什么是人工智能?
人工智能,又称为机器学习,是一种基于神经网络的软件系统,这种技术实际上在几十年前就被开创,但最近凭借强大的新计算资源得以迅速发展。人工智能实现了有效的语音和图像识别,以及生成合成图像和语音的能力。研究人员正在努力使人工智能能够浏览网络、订票、调整食谱等。
但如果你担心类似于《黑客帝国》中的机器崛起 — 不必担心。我们稍后会谈论到这一点!
我们的人工智能指南分为三个主要部分,每个部分我们都会定期更新,可以按任意顺序阅读:
通过阅读本文,你将会对如今的情况有所了解,正如现今任何人都希望了解的那样。随着我们进一步进入人工智能时代,我们还将不断更新和扩展这篇文章。
关于人工智能的一个奇特之处在于,尽管其核心概念已有50多年的历史,但直到最近,即使是技术精通的人们也对其中的大部分内容并不熟悉。所以,如果您感到迷茫,不用担心 —— 每个人都一样。
还有一件事情我们想要在开始时澄清:尽管称之为“人工智能”,但这个术语有点误导。智能没有一个统一的定义,但这些系统所做的事情与大脑相比更接近于计算器。这个计算器的输入和输出只是更加灵活。您可以将人工智能类比为人造椰子 —— 它是模拟智能。
有了这个前提,以下是您在任何关于人工智能的讨论中会遇到的基本术语。
神经网络
我们的大脑主要由相互连接的神经元细胞组成,它们相互交织在一起形成复杂的网络,执行任务并存储信息。自从上世纪60年代以来,就一直尝试在软件中重新创建这个惊人的系统,但所需的处理能力直到15-20年前才得以广泛应用,当时GPU让数字定义的神经网络得以蓬勃发展。实际上,神经网络只是许多点和线组成的:点代表数据,而线代表这些值之间的统计关系。与大脑一样,这可以创建一个多功能系统,它可以迅速接受输入,通过网络传递,并产生输出。这个系统被称为模型。
模型
模型是实际的代码集合,它接受输入并返回输出。术语上与统计模型或模拟复杂自然过程的建模系统的相似性并非偶然。在人工智能中,模型可以指完整的系统,如ChatGPT,或几乎任何AI或机器学习构造,无论它是做什么或产生什么。模型有不同的大小,既指它们所占的存储空间,也指运行它们所需的计算能力。这取决于模型是如何进行训练的。
训练
为了创建一个AI模型,组成系统基础的神经网络被暴露在一堆信息中,这就是所谓的数据集或语料库。在这个过程中,这些巨大的网络创建了该数据的统计表示。这个训练过程是计算密集型最重要的部分,这意味着需要在大量高功率计算机上花费几周或几个月的时间(您可以根据需要延长时间)。这是因为网络不仅复杂,而且数据集可能非常大:数十亿个单词或图像必须进行分析,并在巨大的统计模型中进行表示。另一方面,一旦模型完成训练,当它被使用时可以更小,要求较少的计算资源,这个过程称为推理。
推理
当模型实际执行其任务时,我们称之为推理,这在很大程度上与该词的传统含义相符:通过对现有证据进行推理得出结论。当然,这不完全是“推理”,而是在所吸收的数据中统计性地连接这些数据点,并实际上预测下一个数据点。例如,对于以下序列:"red, orange, yellow…",模型会找到这些词对应于它所吸收的列表的开头,彩虹的颜色,并推断出下一个项目,直到产生了该列表的其余部分。推理通常比训练成本要低得多:可以将其类比为查阅卡片目录而不是组装它。大型模型仍然需要在超级计算机和GPU上运行,但较小的模型可以在智能手机上运行,甚至更简单的设备上运行。
生成型人工智能
人们都在谈论生成型人工智能,这个广义的术语指的是能够生成原创输出(如图像或文本)的人工智能模型。一些人工智能可以进行摘要,一些可以重新组织,一些可以识别等等,但是能够实际生成某种内容的人工智能(无论是否“创造”都是可以争议的)现在尤其受欢迎。只需记住,仅仅因为人工智能生成了某些内容,并不意味着它是正确的,甚至不一定反映现实!它只是在您提出请求之前不存在的东西,就像一个故事或画作。
超越基础知识,以下是在2023年中最相关的人工智能术语。
大型语言模型
大型语言模型是当今最有影响力和多功能的人工智能形式,它们在几乎包括网络上的所有文本和大部分英语文学在内的内容上进行训练。吸收所有这些内容会产生一个巨大的基础模型(继续阅读),其规模之大。大型语言模型能够以自然语言对话并回答问题,并模仿各种风格和类型的书面文件,正如ChatGPT、Claude和LLaMa等模型所展示的。尽管这些模型无疑令人印象深刻,但必须记住它们仍然是模式识别引擎,当它们回答问题时,实际上是试图完成它所识别的模式,无论该模式是否反映现实。大型语言模型在回答问题时经常产生幻觉,我们很快将会谈到这一点。
如果您想了解更多关于大型语言模型和ChatGPT的信息,我们有一篇完全独立的文章介绍这些内容!
基础模型
从头开始对庞大的模型进行训练,需要耗费昂贵且复杂的资源,因此您不希望不得不经常这样做。基础模型是大型从头开始的模型,需要超级计算机才能运行,但它们可以通过减少参数的数量来缩小,通常通过减少参数数量来实现。您可以将这些参数看作是模型需要处理的总点数,现在这个数字可能是百万、十亿甚至万亿。
微调
像GPT-4这样的基础模型很聪明,但它也是经过设计的通才 —— 它吸收了从狄更斯到维特根斯坦再到龙与地下城规则等各种知识,但如果你想要它帮助你写一封求职信,这些知识并没有什么帮助。幸运的是,可以通过使用专门的数据集对模型进行微调,例如使用一些可能正在身边的几千份职位申请。这使得模型在该领域更好地帮助你,同时不会放弃其从其余训练数据中积累的通用知识。
人类反馈强化学习,或RLHF,是一种特殊的微调方法,您将经常听到它 —— 它使用人类与大型语言模型的交互数据来提高其沟通技能。
扩散
从一份关于高级后扩散技术的论文中,您可以看到即使是非常嘈杂的数据也可以重新生成图像。
图像生成可以通过多种方式完成,但迄今为止最成功的方法是扩散,这是稳定扩散、Midjourney和其他流行的生成式人工智能的核心技术。扩散模型通过向它们显示逐渐受损的图像进行训练,逐渐添加数字噪声,直到原始图像不复存在。通过观察这一过程,扩散模型还学会了反向进行此过程,逐渐向纯噪声添加细节,以形成任意定义的图像。对于图像,我们已经开始超越了这一技术,但这种技术是可靠且相对容易理解的,所以不要指望它会很快消失。
幻觉
最初,这是训练中某些图像滑入不相关输出的问题,例如由于训练集中狗的过多存在,建筑物似乎是由狗构成。现在,当AI由于其训练集中的数据不足或冲突而仅仅是编造东西时,我们会说它在幻觉。
这既可以是一种资产,也可以是一种负债;要求AI创建原创甚至是派生艺术作品时,它正在对其输出进行幻觉;可以要求LLM以Yogi Berra风格撰写一首情诗,尽管在其数据集中没有任何这样的存在,它仍然会愉快地这样做。但当需要一个事实性的答案时,这可能成为一个问题;模型会自信地提出一个既是真实的又是幻觉的响应。目前,除了自己检查,没有容易的方法可以分辨哪一个是真实的,哪一个是幻觉的,因为模型本身实际上并不知道什么是“真实”或“虚假”,它只是尽其所能地完成一个模式。
AGI或强人工智能
人工通用智能,或强人工智能,并不是一个很好定义的概念,但最简单的解释是,它是一种足够强大的智能,不仅可以像人类一样执行任务,而且还可以像我们一样学习和改进自己。一些人担心,这种学习、整合思想然后学习和增长的循环将是一个自我持续的循环,从而导致一个无法限制或控制的超级智能系统。一些人甚至提出延迟或限制研究以阻止这种可能性。
这确实是一个可怕的想法,当然,电影如《黑客帝国》和《终结者》已经探讨了如果人工智能失控并试图消灭或奴役人类会发生什么。但这些故事并没有现实基础。我们在ChatGPT等东西中看到的智能外观是令人印象深刻的,但与我们与“真正”的智能相关的抽象推理和动态多领域活动几乎没有共同之处。虽然很难预测事情会如何发展,但将AGI视为星际太空旅行的某种东西可能会有所帮助:我们都理解这个概念,并且似乎正在朝着这个方向努力,但与此同时,我们离实现类似目标还有很长的距离。由于需要巨大的资源和基础科学进步,没有人会突然偶然地完成它!
思考AGI是有趣的,但在评论家指出,尽管受到限制,但人工智能已经在今天提出了真正和重要的威胁,不应该引入麻烦。没有人想要天网,但您不需要一台配备核武器的超级智能来造成真正的伤害:人们今天正在失去工作,并受到恶作剧的影响。如果我们无法解决这些问题,那么我们在面对T-1000时会有多少机会呢?
OpenAI
如果在人工智能领域有一个家喻户晓的名字,那就是OpenAI。正如其名所示,OpenAI最初是一个旨在进行研究并以更加开放的方式提供研究结果的组织。后来,它进行了重组,成为一个更加传统的盈利性公司,通过API和应用程序提供对其在语言模型(如ChatGPT)方面的进展的访问。它由Sam Altman领导,他是一位技术乌托邦亿万富翁,但他也警告过AI可能带来的风险。OpenAI是LLMs领域的领军者,同时也在其他领域进行研究。
Microsoft
正如您可能预期的那样,Microsoft在人工智能研究方面做出了相当大的努力,但与其他公司一样,它更多地未能将其实验转化为重要产品。它最明智的举动是早期投资于OpenAI,从而为其赢得了与OpenAI的独家长期合作伙伴关系,该合作伙伴关系现在为其Bing会话代理提供动力。虽然其自身的贡献较小且不太适用,但该公司在研究领域具有相当大的存在。
Google
Google以其大胆创新的举措而闻名,然而尽管其研究人员实际上发明了直接导致当今人工智能爆炸的技术——变换器,但在人工智能方面却出现了疏漏。现在,Google正在努力开发自己的LLMs和其他代理,但很明显,它在花费了过去十年中的大部分时间和金钱来推动过时的“虚拟助手”AI概念之后,正在努力赶超。首席执行官Sundar Pichai曾多次表示,该公司正在坚定地将自己定位于搜索和生产力领域的人工智能。
Anthropic
在OpenAI转变不再开放的道路后,兄妹Dario和Daniela Amodei离开OpenAI,创办了Anthropic,旨在填补一个开放且具有伦理考虑的人工智能研究组织的角色。凭借他们手头的资金,他们是OpenAI的严肃竞争对手,即使他们的模型(如Claude和Claude 2)还不如OpenAI的模型那么受欢迎或知名。
稳定性
尽管具有争议性,但稳定性代表了“随心所欲”的开源人工智能实施学派,它会汇集互联网上的所有内容,并且如果你有足够的硬件运行它,它会使其训练的生成式人工智能模型免费提供。这与“信息想要自由流通”的哲学非常一致,但也加速了一些伦理可疑的项目,如生成色情图像并在未经同意的情况下使用知识产权(有时甚至同时进行)。
埃隆·马斯克
马斯克是一个不容忽视的人物,他对于失控的人工智能表达了担忧,同时在他早期为OpenAI做出贡献后,该机构发展的方向并不符合他的意愿,这让他有些不满。虽然马斯克在这个领域不是专家,但像往常一样,他的言行和评论引发了广泛的回应(他是上述提到的“人工智能暂停”信件的签署人之一),并且他正试图启动自己的研究机构。
谷歌助手据报道正在转向生成式人工智能
根据Axios最初报道的一封内部电子邮件,谷歌助手现在正在进行生成式人工智能的改进。
该邮件称,助手团队领导“看到了利用最新LLM [大型语言模型] 技术为助手进行增强的巨大机会”,并描述了一些组织变化以实现这一目标。
Stability AI发布了最新的图像生成模型
Stability AI宣布推出了Stable Diffusion XL 1.0,这是一种文本到图像模型,该公司将其描述为迄今为止“最先进”的发布版本。Stable Diffusion XL 1.0相较于其前身提供了“更生动”、“更准确”的颜色以及更好的对比度、阴影和光照,Stability声称。该工具可以在GitHub上开源使用,另外也可在Stability的API和消费者应用程序ClipDrop和DreamStudio中使用。
AI领袖警告参议院快速行动和过快行动的风险
AI研究界的领袖们出席参议院司法委员会会议,讨论和回答有关人工智能的问题。他们的广泛共识大致分为两类:我们需要尽快采取行动,但要轻触,否则如果我们不前进,就会冒着滥用AI的风险,或者如果我们匆忙行事,行业将会受到限制。
OpenAI关闭了其AI分类器工具
尽管许多人使用了该公司的AI分类器工具,并且可能不明智地依赖它来捕捉低努力作弊行为,但OpenAI已经将其退役,因为其广受批评的“低准确率”。
TechCrunch对一组AI写作检测工具进行的测试得出结论,这些工具在最佳情况下可能命中或失误,最差的情况下完全毫无价值。在多个检测器中,GPTZero正确识别了五个生成的文本片段,而OpenAI的分类器只识别了一个。
顶尖AI公司访问白宫承诺安全承诺
拜登政府从七家最大的AI开发商那里收集了“自愿承诺”,以在计划中的行政命令之前追求共同的安全和透明目标。
OpenAI、Anthropic、Google、Inflection、Microsoft、Meta和Amazon是参与这一非约束性协议的公司。尽管实质性的AI立法可能仍然需要几年时间,但这个行业正在以超高速发展,许多人担心可能会失控。
苹果正在开发一个AI聊天机器人
为了与OpenAI、谷歌等竞争,苹果已经创建了一个被一些工程师内部称为“苹果GPT”的聊天机器人。
报道称,苹果建立了自己的框架,代号为“Ajax”,用于创建大型语言模型。Ajax在谷歌云上运行,并使用谷歌的机器学习框架Google JAX构建,据Bloomberg报道。苹果正在利用Ajax创建LLMs,并作为内部ChatGPT风格工具的基础。
AI制造商未经作者许可或补偿窃取书籍
在一封由8000多位小说、非小说和诗歌作者签署的公开信中,像ChatGPT、Bard、LLaMa等大型语言模型背后的AI公司被指责在未经许可的情况下使用他们的作品。
该信函要求这些公司采取以下措施:
Anthropic发布了Claude 2
Claude 2从7月11日起在美国和英国的Web和付费API(有限访问)上推出测试版。Claude 2可以搜索文档、总结、写作、编码以及回答特定主题的问题。但该公司声称Claude 2在几个学术领域中表现更优越。
OpenAI推出了GPT-4
从7月6日开始,所有现有的OpenAI API开发人员都可以访问GPT-4,前提是他们有“成功付款历史”。该公司计划在7月底之前向新开发人员开放访问,并在此后根据“计算资源的可用性”开始提高可用性限制。
从2024年1月4日开始,某些较旧的OpenAI模型,特别是GPT-3及其衍生模型,将不再可用,并将被新的“基础GPT-3”模型替代。使用旧模型的开发人员将必须在1月4日之前手动升级其集成,而希望在1月4日之后继续使用微调的旧模型的人将需要在新的基础GPT-3模型之上进行微调替换。
欧洲技术领袖签署公开信,警告不要过度监管AI的欧盟法律草案
这封公开信表示,人工智能提供了“重新加入技术前沿的机会”,但目前在欧盟层面的监管提案可能会陷入扼杀机会的境地。
Inflection获得13亿美元的投资,以构建更“个人化”的AI
AI创业公司Inflection AI旨在为每个人创建“个人化的AI”,已经完成了由Microsoft、Reid Hoffman、Bill Gates、Eric Schmidt和新投资者Nvidia领导的13亿美元融资轮。曾与谷歌旗下的AI实验室DeepMind合作创立的CEO Mustafa Suleyman表示,新资本将支持Inflection构建和设计其第一个产品Pi,这是一个名为Pi的AI助手。
美国或将进一步限制向中国出口芯片
美国商务部可能会在下个月(7月)尽早禁止向中国的客户出口芯片,包括英伟达在内的制造商。限制AI芯片出口到中国的最新举措是美国在限制中国在AI领域的进展,尤其是在军事领域方面的一项更广泛策略的一部分。然而,这些措施也对中国的商业AI部门产生了不良影响,许多公司在美国和中国都拥有团队。
ChatGPT使用Bing,Bing使用ChatGPT
ChatGPT Plus订阅用户现在可以在ChatGPT应用程序上使用一个名为“Browsing”的新功能,通过该功能,ChatGPT可以搜索Bing,以获取提示或问题的答案。OpenAI表示,浏览功能特别适用于与当前事件和其他“超越[ChatGPT的]原始训练数据”的信息相关的查询。当禁用浏览功能时,ChatGPT的知识截至于2021年。
AI不能获得格莱美奖
根据格莱美奖的资格标准更新,如果音乐家的AI辅助作品有资格参加格莱美奖,他们需要确保他们的人类贡献是“有意义的,不仅仅是微不足道的”。资格标准的更新规定:“只有人类创作者有资格提交考虑”,“不包含人类作者创作的作品在任何类别中都不具备资格”。
谷歌旗下的研究实验室DeepMind声称,其下一个聊天机器人将与ChatGPT竞争
DeepMind正在使用AlphaGo的技术,AlphaGo是DeepMind的AI系统,它是第一个在围棋比赛中击败职业人类选手的系统,来制作一个名为Gemini的聊天机器人,该机器人将具备规划或解决问题的能力,以及分析文本的能力,DeepMind的首席执行官Demis Hassabis告诉Wired的Will Knight。
Salesforce承诺投资5亿美元用于AI初创公司
Salesforce宣布,它将其产生性AI基金的规模从2.5亿美元增加到5亿美元。自从今年3月成立Generative AI基金以来,该基金已经在一些前沿的生成式AI技术公司中投资。尽管远非唯一一家主要投资于生成式AI的基金,但Salesforce的目标是通过优先考虑所谓的“道德”AI技术来区别其基金。
英伟达成为万亿美元公司
GPU制造商Nvidia在向游戏玩家和加密货币挖掘者出售硬件方面表现不错,但AI产业使得对其硬件的需求急剧增加。该公司巧妙地利用了这一点,前不久,该公司的股票达到了413美元,突破了象征性(但却是如此强烈)的万亿美元市值。他们似乎毫不减速,就像最近在Computex展上展示的那样…
在Computex展上,Nvidia再次承诺投入AI
在台北的Computex展上,Nvidia首席执行官Jensen Huang提到了该公司的Grace Hopper超级芯片,用于加速计算(采用了他们的术语),并演示了一种据称可以将任何人都变成开发者的生成式AI。
OpenAI的Sam Altman代表AI向世界游说
虽然一些人认为Altman最近在为美国政府提供AI政策建议,但也有人认为这是让狐狸在鸡舍中制定规则。欧盟的各个法规制定机构也在寻求意见,Altman正在进行一次大规模的巡讲,同时警告不要过度监管和无限制的AI的危险。如果这些观点对您来说似乎是相互矛盾的……不用担心,您并不是唯一一个这样认为的人。
Anthropic筹集4.5亿美元用于其新一代AI模型
我们在发布这一筹款和计划的详细信息之前,似乎已经为他们剧透了,但Anthropic现在正式获得4.5亿美元,并致力于继Claude和其它模型的继任者上。很明显,AI市场足够大,足够多的主要供应商可以在顶层竞争——只要他们有足够的资本达到那里。
TikTok正在测试自己的内部AI,名为Tako
视频社交平台TikTok正在测试一种新的对话式AI,您可以向其询问任何问题,包括您正在观看的内容。这个想法是,与其只是搜索更多“哈士奇嚎叫”的视频,您可以问Tako“哈士奇为什么会那么多吠叫?”它将给出有用的答案,并指向更多的内容供您观看。
微软将ChatGPT集成到Windows 11
在向OpenAI投资了数亿美元后,微软决心要物有所值。它已经将GPT-4集成到了其Bing搜索平台中,但现在该Bing聊天体验将通过操作系统上的一个右侧栏在每台Windows 11计算机上都可用——实际上,可能是无法避免的。
谷歌将AI添加到几乎所有领域
谷歌在人工智能领域正在迎头赶上,虽然它投入了大量资源,但其战略仍然有些模糊。这次的I/O 2023活动充满了可能永远不会面向广大受众的实验性功能。但他们肯定在全力以赴,以重新进入这个领域。
文章来源:TechCrunch
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。