赞
踩
人工智能(Artificial Intelligence,AI)的执行指南讲述,从机器学习和通用人工智能到神经网络。
这个问题取决于你问的对象是谁。
早在20世纪50年代,这个领域之父Minsky和McCarthy就将人工智能描述为由程序(program)或机器(machine)执行的任何任务,这些任务是,如果人类执行相同的活动,我们会说人类必须运用智力来完成这项任务。
显然,这是一个相当广泛的定义,这就是为什么您有时会看到关于某物是否真的是AI的争论的原因。
人工智能系统通常至少会展示出与人类智能相关的以下一些行为:规划(planning),学习(learning),推理(reasoning),问题解决(problem solving),知识表示(knowledge representation),感知(perception),运动(motion)和操作(manipulation),以及在较小程度上的社会智能(social intelligence)和创造力(creativity)。
如今,人工智能无处不在,比如它被用来向您推荐下一步应该在网上购买什么,了解您对亚马逊的Alexa和苹果的Siri等虚拟助手(virtual assistants)所说的话,识别照片中的人物和内容,发现垃圾邮件或检测信用卡欺诈 。
在很高的层次上,人工智能可以分为两种类型:狭义AI和通用AI(narrow AI,general AI)。
狭义AI是当今我们在计算机中所看到的一切:已经被教导或学会如何执行特定任务而无需明确编程如何执行这些任务的智能系统。
这种类型的机器智能很明显,如在Apple iPhone上的Siri虚拟助手的语音和语言识别(the speech and language recognition),自动驾驶汽车(self-driving cars)的视觉识别系统(the vision-recognition systems),根据您过去购买的产品来推荐您喜欢的产品的推荐引擎(the recommendation engines)。 与人类不同,这些系统只能学习或被教导如何执行特定任务,这就是为什么它们被称为狭义AI。
狭义AI有大量的新兴应用:解释无人机(drones)对石油管道等基础设施进行视觉检查的视频信息,组织个人和企业日历,回应简单的客户服务(customer-service)查询,与其他智能系统配合以执行任务,例如在合适的时间和地点预订酒店,帮助放射线科医生在X射线中发现潜在的肿瘤,在网上标记不适当的内容,从IoT设备收集的数据中检测电梯的磨损,等等。
人工通用智能与众不同,它是在人类中发现的适应性智力(adaptable intellect )的类型,是一种灵活的智能形式,能够学习如何执行截然不同的任务,从理发到构建电子表格,或根据积累的经验推理各种各样的主题。 这类AI在电影中更为常见,例如2001年的HAL或The Terminator中的Skynet,但如今还不存在,而且AI专家们对于它多久会变成现实存在着激烈的分歧。
特别报告:如何实施人工智能和机器学习(免费PDF)
AI研究人员Vincent CMüller和哲学家Nick Bostrom在2012/13年度对四组专家进行的一项调查显示,到2040年至2050年,人工通用智能(Artificial General Intelligence,AGI)的开发机会将达到50%,到2075年将上升到90%。 该小组甚至更进一步,预测所谓的“超级智能”(superintelligence),被Bostrom定义为“在所有感兴趣的领域中大大超过人类的认知(cognitive)表现的任何智力”,预计在AGI实现后约30年。
也就是说,一些AI专家认为,鉴于我们对人类大脑的了解有限,这样的预测是非常乐观的,并且认为AGI仍有几个世纪之遥。
AI有着广泛的研究领域,其中许多研究相互补充。
当前机器学习(machine learning)正在兴起,它是向计算机系统馈送大量数据,然后用这些数据学习如何执行特定任务,例如理解语音或为照片加说明文字(captioning a photograph)。
机器学习过程的关键是神经网络(neural networks)。 这些是由大脑启发的网络,由相互连接的算法层(layers)的组成,称为神经元(neurons),它们相互馈送数据,并且可以通过修改输入数据在各层之间传递的重要性来训练它们执行特定任务。 在训练这些神经网络的过程中,附加在不同输入上的权重(weights)将继续变化,直到神经网络的输出与期望的输出非常接近为止,此时网络将“学习”如何执行特定任务 。
机器学习的一个子集是深度学习(deep learning),在这种学习中,神经网络被扩展为具有大量层的庞大网络,这些层使用大量数据进行训练。 正是这些深度神经网络(deep neural networks)推动了当前计算机执行语音识别和计算机视觉等任务的能力的飞跃。
立即下载:IT领导者深度学习指南(技术专业研究)(Tech Pro Research)
有各种类型的神经网络,各有优缺点。 循环神经网络(recurrent neural networks)是一种特别适合于语言处理和语音识别的神经网络,而卷积神经网络(convolutional neural networks)则更常用于图像识别。 神经网络的设计也在不断发展,研究人员最近改进了一种更有效的深度神经网络形式,称为长短时记忆或LSTM,使其能够足够快地运行以用于Google Translate等点播系统(on-demand systems )。
AI研究的另一个领域是进化计算(evolutionary computation),它借鉴了达尔文(Darwin)的著名自然选择(natural selection)理论,并发现遗传算法(genetic algorithms)经历了几代之间的随机突变(random mutations)和组合(combinations),试图进化出给定问题的最优解决方案(the optimal solution)。
这种方法甚至被用来帮助设计AI模型,有效地利用AI来帮助构建AI。这种使用进化算法用于优化神经网络的方法称为神经进化(neuroevolution),并且随着智能系统的使用变得越来越普遍,尤其是当对数据科学家的需求经常超过供给时,这种方法在帮助设计高效AI方面可以发挥重要作用。 Uber AI Labs最近展示了该技术,该实验室发布了有关使用遗传算法训练深度神经网络以解决强化学习(reinforcement learning)问题的论文。
最后还有专家系统(expert systems),在这种系统中,用规则(rules)对计算机进行编程,使它们可以基于大量输入来做出一系列决策(decisions),从而使机器能够模仿(mimic)特定领域中人类专家的行为。这些基于知识的系统(knowledge-based systems)的一个例子可能是驾驶飞机的自动驾驶系统(an autopilot system)。
近年来,AI研究的最大突破是在机器学习领域,尤其是在深度学习领域。
这在某种程度上是由于数据的易获得性所驱动,但更重要的是由于近年来并行计算能力的爆炸式增长,在此期间,使用GPU集群来训练机器学习系统变得更加普遍。
这些集群不仅为训练机器学习模型提供了强大得多的系统,而且现在可以作为Internet上的云服务广泛使用。随着时间的推移,像Google和Microsoft这样的主要科技公司已经转向使用专门针对运行和最近用于训练机器学习模型的专用芯片(chips)。
这些定制芯片中的一个例子是Google的Tensor处理单元(Tensor Processing Unit,TPU),其最新版本加快了使用Google TensorFlow软件库构建的有用的机器学习模型从数据中推断信息的速率,以及它们被训练的速率。
这些芯片不仅用于训练DeepMind和Google Brain的模型,还用于支持Google Translate和Google Photo中的图像识别的模型,以及允许公众使用Google的TensorFlow Research Cloud构建机器学习模型的服务。第二代这些芯片已于去年5月在Google的I/O会议上揭晓,其中的一系列新TPU能够训练用于翻译的Google机器学习模型,所需时间仅为高端图形处理单元(graphics processing units,GPU)的一半。
如前所述,机器学习是AI的一个子集,通常分为两大类:监督学习和非监督学习。
教导AI系统的一个常用技术是通过使用大量带标签的例子(labeled examples)来训练它们。 这些机器学习系统被馈入大量数据,这些数据已被标注以突出感兴趣的特征。 这些可能是被标记以表明它们是否包含狗的照片,或带有脚注以表明“bass”一词与音乐还是鱼类有关的书面句子。 经过训练后,系统便可以将这些标签(labels)应用于新数据,例如刚刚上传的照片中的一只狗。
这种通过例子教导机器的过程称为监督学习(supervised learning),标记这些例子的角色通常由在线工作人员执行,他们通过Amazon Mechanical Turk之类的平台雇用。
训练这些系统通常需要大量的数据,有些系统需要搜寻数百万个例子来学习如何有效地执行任务,尽管在大数据和大规模数据挖掘的时代,这越来越有可能。训练数据集庞大且规模不断扩大,Google的Open Images Dataset拥有约900万张图像,而其带有标签的视频存储库YouTube-8M链接了700万个带有标签的视频。 ImageNet是此类早期数据库之一,拥有超过1400万张分类图像。该文件经过两年的编写,由近50,000人(其中大部分是通过Amazon Mechanical Turk招募的)汇集在一起的,他们检查,分类并标记了将近10亿张候选图片。
从长远来看,与庞大的计算能力相比,访问具有大量标记数据集的重要性可能不那么重要。
近年来,生成对抗网络(Generative Adversarial Networks,GANs)展示了机器学习系统如何通过馈入少量标记数据然后能够生成大量新数据来自学。
这种方法可能会导致半监督学习(semi-supervised learning)的兴起,在半监督学习中,系统可以使用远远少于当今使用监督学习的训练系统所需要的标记数据来学习如何执行任务。
相比之下,非监督学习(unsupervised learning)则使用另一种方法,即算法尝试识别数据中的模式(patterns),寻找可用于对数据进行分类的相似性。
一个可能的例子是将重量相似的水果或发动机尺寸相似的汽车聚集在一起。
该算法并非预先设置为挑选特定类型的数据,它只是寻找可以根据其相似性进行分组的数据,例如Google News每天将相似主题的故事分组在一起。
强化学习(reinforcement learning)的粗略类比是当宠物在表演把戏时奖励其零食。
在强化学习中,系统尝试根据其输入数据最大化奖励,基本上要经过反复试验的过程,直到获得最佳结果。
强化学习的一个例子是Google DeepMind的Deep Q-network,它已被用于在各种经典视频游戏中实现最佳人类表现。 系统从每个游戏中获取像素,并确定各种信息,例如屏幕上对象之间的距离。
通过查看每场游戏中获得的分数,系统会建立一个模型,该模型的动作将在不同情况下使分数最大化,例如,在视频游戏Breakout的情况下,应将球拍移至哪个位置以拦截球。
随着AI在现代软件和服务中扮演越来越重要的角色,每家主要的技术公司都在努力开发强大的机器学习技术,以供内部使用并通过云服务向公众出售。
每一个都经常因为在AI研究上的突破性进展而成为头条新闻,尽管可能是Google及其DeepMind AI的AlphaGo对AI的公众意识产生了最大的影响。
所有主要的云平台,Amazon Web Services,Microsoft Azure和Google Cloud Platform,提供对GPU阵列的访问,以训练和运行机器学习模型,而Google还准备让用户使用其张量处理单元(Tensor Processing Units)——定制芯片,其设计针对训练和运行机器学习模型进行了优化。
所有必要的相关基础设施和服务都可以从三大平台获得,基于云的数据存储,能够存储训练机器学习模型所需的大量数据,转换数据以准备进行分析的服务,清楚地显示结果的可视化工具,以及简化模型构建的软件。
这些云平台甚至简化了自定义机器学习模型的创建,Google最近发布了一项名为Cloud AutoML的服务,该服务可以自动创建AI模型。这项拖放服务可建立自定义的图像识别模型,并且要求用户没有机器学习方面的专业知识。
基于云的机器学习服务在不断发展,2018年初,亚马逊(Amazon)透露了许多新的AWS产品,旨在简化机器学习模型的训练过程。
对于那些不想建立自己的机器学习模型而是想要使用AI驱动的按需服务(例如语音,视觉和语言识别)的公司,Microsoft Azure在服务的广泛性方面脱颖而出,紧随其后的是Google Cloud Platform,然后是AWS。与此同时,IBM除了更广泛的按需产品之外,还试图出售针对特定领域的AI服务,涵盖从医疗保健到零售的所有领域,将这些产品组合在IBM Watson旗下,并于近期投资20亿美元收购了The Weather Channel,以解锁大量数据来增强其AI服务。
在内部,每个技术巨头,以及Facebook等其他公司,都使用AI来帮助推动各种公共服务:提供搜索结果,提供建议,识别照片中的人物和事物,按需翻译,发现垃圾邮件等等。
但是这场AI战争最明显的体现之一就是虚拟助手的兴起,例如苹果的Siri,亚马逊的Alexa,谷歌助手和微软的Cortana。
开发这些助手需要大量技术,严重依赖语音识别和自然语言处理,以及需要庞大的语料库来回答查询。
但是,虽然苹果的Siri可能首先成为知名度,但谷歌和亚马逊的助手此后在AI领域已经超过了苹果,谷歌助手能够回答各种各样的查询,而亚马逊的Alexa则具有大量的“技能”,由第三方开发人员创建这些技能以增加其功能。
更多阅读:我们如何学会与计算机交谈,以及他们如何学会回复(PDF下载)
尽管Cortana已内置在Windows 10中,但最近经历了一段特别艰难的时期,有人建议主要的PC制造商将Alexa内置到笔记本电脑中,这增加了人们对Cortana的日子是否屈指可数的猜测,尽管微软很快对此予以拒绝。
认为美国科技巨头拥有AI领域是一个很大的错误。 中国公司阿里巴巴,百度和联想正在从电子商务到自动驾驶等各个领域大力投资AI。 作为一个国家,中国正在推行三步走的计划,将人工智能变成该国的核心产业,到2020年,人工智能产业的价值将达到1500亿元人民币(220亿美元)。
百度已投资开发无人驾驶汽车(self-driving cars),该技术由其深度学习算法百度自动大脑(Baidu AutoBrain)提供支持,并且经过数年的测试,计划在2018年推出全自动驾驶汽车并在2021年实现量产。
百度还与英伟达(Nvidia)合作,使用AI为全球汽车制造商创建了云到车自动驾驶汽车平台。
薄弱的隐私法,庞大的投资,协同的数据收集,以及百度,阿里巴巴和腾讯等大型公司的大数据分析,将这些结合,意味着一些分析师认为,在未来的人工智能研究方面,中国将比美国更具优势,一位分析师描述了中国率先以达到500:1的优势领先美国超过中国的可能性。
虽然您可以尝试在家中构建自己的GPU阵列并开始训练机器学习模型,但尝试与AI相关的服务的最简单方法可能是通过云。
所有主要的技术公司都提供各种AI服务,从用于构建和训练自己的机器学习模型的基础结构,到允许您按需访问AI驱动的工具(如语音,语言,视觉和情感识别)的Web服务。
太多的东西无法汇总成一个完整的列表,但是最近的一些亮点包括:2009年,谷歌表明其自动驾驶的丰田普锐斯(Toyota Prius)有可能完成10次100英里以上的旅程,使社会走上无人驾驶汽车的道路 。
2011年,计算机系统IBM Watson赢得了美国问答游戏节目《危险》(Jeopardy) ,击败了该节目有史以来最优秀的两位选手,它成为了全世界的头条新闻。为了赢得节目,Watson使用自然语言处理和对处理的大量数据仓库的分析,从而可以回答人类提出的问题,通常只需不到一秒钟的时间。
在2012年6月,显而易见的是,机器学习系统在计算机视觉方面的表现非常出色,而Google训练了一种识别互联网上最喜欢的猫的系统。
自Watson获胜以来,也许最著名的机器学习系统的有效性证明是2016年Google DeepMind AlphaGo AI击败了围棋(Go)的人类特级大师,围棋是一款古老的中国游戏,其复杂性困扰了计算机数十年。围棋每回合大约200步,而国际象棋中只有20步。在进行围棋游戏的过程中,有太多可能的动作,以至于从计算的角度来看,事先搜索每个动作以找出最佳玩法的成本太高。取而代之的是,AlphaGo受到了如何玩游戏的训练,方法是在3000万个围棋游戏中采取人类专家的动作并将其馈入深度学习神经网络。
训练这些深度学习网络可能会花费很长时间,随着系统逐渐完善其模型以实现最佳结果时,需要摄取和迭代大量数据。
但是,最近Google使用AlphaGo Zero改进了训练过程,这是一种跟自己玩“完全随机”游戏的系统,然后从结果中学习。在去年享有盛名的神经信息处理系统(Neural Information Processing Systems,NIPS)会议上,谷歌DeepMind首席执行官Demis Hassabis透露AlphaGo还精通了象棋和将棋(shogi)游戏。
而且AI继续冲刺超越新的里程碑,去年由OpenAI训练的系统在在线多人游戏Dota 2的一对一比赛中击败了世界顶级玩家。
同年,OpenAI创建了AI agents,这些agent发明了它们自己的语言来更有效地合作和实现它们的目标,随后不久,Facebook训练agent进行谈判以及甚至撒谎。
对机器人能够自主行动、理解和导航周围的世界的愿望意味着机器人技术和人工智能之间自然存在重叠。 尽管AI只是机器人技术中使用的一种技术,但AI的使用正在帮助机器人进入新领域,例如无人驾驶汽车,送货机器人以及帮助机器人学习新技能。 通用汽车(General Motors)最近表示,它将在2019年之前制造出无方向盘或踏板的无人驾驶汽车,而福特(Ford)承诺到2021年这样做,而Google母公司Alphabet旗下的自动驾驶集团Waymo不久将在凤凰城(Phoenix)提供无人出租车服务 。
特别报道:技术与运输的未来(免费PDF)。这本电子书探讨了新兴的自动运输技术及其对社会和商业未来的影响。
我们正处于拥有可以创建照片般逼真的图像或以完美音调的方式复制某人声音的神经网络。 随之而来的是带来巨大破坏性社会变革的潜力,例如不再能够将视频或音频素材视为真实的。 人们也开始担心这种技术将如何被用来盗用人们的形象,已经有工具被用来令人信服地将著名女演员拼接成成人电影。
机器学习系统已经帮助计算机以几乎95%的准确度识别了人们在说什么。 微软的人工智能与研究小组最近报告说,它已经开发出了一种系统,该系统能够像人类转录员一样准确地翻译口语。
随着研究人员追求99%的准确性目标,期望与计算机对话成为一种常态(norm)和更传统的人机交互形式。
近年来,人脸识别系统(facial-recognition systems)的准确性有了飞跃,中国科技巨头百度表示,只要视频中的人脸足够清晰,它就可以以99%的准确性匹配人脸。 虽然西方国家的警察通常只在大型活动中使用面部识别系统进行试验,但在中国,官方正在实施一项全国性计划,将全国的CCTV连接到面部识别系统,并使用AI系统跟踪嫌疑人和可疑行为,并且也正在试验警察使用面部识别眼镜。
尽管全球各地的隐私法规各不相同,但对AI技术(包括可以识别情绪的AI)的侵入性使用可能会逐渐在其他地方变得越来越普遍。
人工智能最终可能会对医疗保健产生巨大影响,帮助放射线医师从X射线中挑选出肿瘤,帮助研究人员发现与疾病相关的基因序列,并确定可能导致更有效药物的分子。
全世界的医院已经进行了AI相关技术的试验。 其中包括IBM的Watson临床决策支持工具,该工具由Memorial Sloan Kettering癌症中心的肿瘤学家进行训练,以及英国国家卫生服务局(National Health Service)对Google DeepMind系统的使用,它将帮助发现眼部异常并简化头颈部癌症患者的筛查流程。
同样,这取决于您问谁。随着以AI为动力的系统变得越来越强大,因此关于不利因素的警告也变得更加严峻。
特斯拉(Tesla)和SpaceX首席执行官Elon Musk宣称,人工智能是“人类文明生存的根本风险”。为了推动更强大的监管监督和开展更多负责任的研究以减轻AI的负面影响,他成立了OpenAI,这是一家非盈利性人工智能研究公司,旨在促进和发展有利于整个社会的友好AI。同样,著名的物理学家斯蒂芬·霍金(Stephen Hawking)警告说,一旦创建了足够先进的人工智能,它将迅速发展到远远超过人类能力的地步,这种现象被称为奇点(singularity),并可能对人类构成生存威胁。
然而,对于某些AI研究人员而言,认为人类即将濒临AI爆炸将使我们的智力相形见绌,这一观点似乎很荒谬。
英国剑桥的微软研究总监Chris Bishop强调,当今AI的狭义智能与人类的通用智能有多大不同,他说,当人们担心“终结者和机器的崛起等等?毫无意义,是的,充其量,这样的讨论还需要几十年。”
人工智能系统替代许多现代体力劳动的可能性也许是更可靠的近期可能性。
尽管AI不会取代所有工作,但可以肯定的是AI会改变工作的性质,唯一的问题是自动化将如何快速和深刻地改变工作场所。
几乎没有一个人类领域是AI没有潜力去发挥影响的。正如AI专家吴恩达(Andrew Ng)所说:“许多人都在做例行的重复性工作。不幸的是,技术特别擅长使例行的重复性工作自动化”,他说他认为“未来几十年技术失业的风险很大”。
关于哪些工作将被取代的证据开始出现。亚马逊刚刚在西雅图推出了无收银超级市场Amazon Go,顾客可以从货架上取走物品然后离开。对于美国超过300万的收银员来说,这意味着什么尚待观察。亚马逊再次引领使用机器人提高仓库效率的方式。这些机器人将产品货架运送到人工拣选人员,人工拣选人员选择要发送的物品。亚马逊在其履行中心拥有超过100,000个机器人,并计划增加更多机器人。但是亚马逊还强调,随着机器人数量的增长,这些仓库中的人工人数也随之增加。但是,亚马逊和小型机器人公司正在努力使仓库中剩余的体力劳动自动化,因此,手动和机器人劳动将继续齐头并进并不是必然的。
特别报道:2020年的IT工作:领导者指南(免费PDF)。ZDNet和TechRepublic研究了AI,大数据,云计算和自动化对IT工作的巨大影响,以及公司如何适应。
全自动无人驾驶汽车还不是一个现实,但是根据一些预测,即使不考虑对快递员和出租车司机的影响,仅自动驾驶卡车行业就有望在未来十年内占据170万个工作岗位。
然而,一些最容易实现自动化的工作甚至不需要机器人技术。 目前,有数百万人从事管理,在系统之间输入和复制数据,追踪和预订公司的约会。 随着软件能够更好地自动更新系统并标记重要信息,因此对管理员的需求将下降。
就像每一次技术变革一样,新的工作岗位将被创造出来,以取代那些失去的工作岗位。然而,目前还不确定的是,这些新角色能否被迅速产生,足以为那些被取代的人提供就业机会,以及新失业者是否具备必要的技能或性情,以填补这些新兴角色的空缺。
更多阅读:人工智能:这将导致工作领域的重大动荡。计算机视觉,语音,分析和移动机器人技术的进步有望影响与此技能相关的任何工作。
并非每个人都是悲观主义者。 对于某些人来说,人工智能是一种可以增加而不是替代工人的技术。 不仅如此,而且他们认为,商业上有必要不完全取代人们,因为AI辅助工人,想想一个配备AR耳机的人工礼宾人员会在客户要求之前确切告诉他们客户的需求,比独立运作的AI更具生产力或效率。
在AI专家中,关于人工智能系统将以多快的速度超越人类的能力,存在着广泛的看法。
牛津大学人类未来研究所邀请了数百名机器学习专家来预测未来几十年的AI能力。
值得注意的日期包括:AI写作的论文可能在2026年被认为是人类写的,卡车司机将在2027年被裁员,AI将在2031年在零售业超越人类能力,到2049年将写作畅销书,并在2053年完成外科医生的工作 。
他们估计,在45年内AI在所有任务上击败人类并在120年内使所有人类工作自动化的可能性相对较高。
机器学习和人工智能在五个领域的进步将简化数据准备,发现,分析,预测和数据驱动的决策。
Deloitte的最新研究表明,认知技术的早期采用者对其当前和未来的作用持积极态度。
很容易陷入关于人工智能消灭数以百万计工作的厄运和悲观的预测中。这是一个现实检查。
人工智能如何引发一种新型的网络犯罪(TechRepublic)
犯罪分子现在不再躲在面具下抢劫银行,而是躲在人工智能后面进行攻击。但是,金融机构也可以使用AI来打击这些犯罪。
马斯克(Elon Musk):人工智能可能引发第三次世界大战(CNET)
这位连任的首席执行官已经在打明天的科幻战争,他仍然比其他任何事情都更关注杀手机器人。
[1] What is AI? Everything you need to know about Artificial Intelligence
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。