赞
踩
-
通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力/应用对这三个技术领域进行介绍:
-
计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。
-
计算机视觉现已有很多应用,这表明了这类技术的成就,也让我们将其归入到应用阶段。随着深度学习的发展,机器甚至能在特定的案例中实现超越人类的表现。但是,这项技术离社会影响阶段还有一定距离,那要等到机器能在所有场景中都达到人类的同等水平才行(感知其环境的所有相关方面)。
阶段 | 年份 | 说明 |
---|---|---|
研究 | 1959 | Hubel和Wiesel对猫进行了实验(为了研究视觉的工作方式) |
1963 | 计算机视觉领域的先驱Larry Roberts在他的博士论文中试图提取[积木世界(Block World)]的3D几何信息 | |
1966 | Summer Vision项目启动,人们普遍认为这意味着计算机视觉的 诞生 | |
工程 | 1980 | David Marr的《视觉(Vision)》一书影响和激励了这一领域的研究者,该书脂示了以【层】的方式着待图像的思想 |
应用 | 1980 | 光学字符识别(OCR)技术开始在工业应用中使用 |
2001 | Viola和Jones开始了面部检测研究;计算机视觉的研究重心发生转移,从建模物体的3D形状转向了识别物体是什么 | |
2009 | imageNet建立 | |
2012 | AlexNet在ImageNet 竞赛中获胜 | |
2015 | Google Cloud Vision API[18]开放 |
-
语音识别已经处于应用阶段很长时间了。最近几年,随着大数据和深度学习技术的发展,语音识别进展颇丰,现在已经非常接近社会影响阶段了。
语音识别领域仍然面临着声纹识别和鸡尾酒会效应,等一些特殊情况的难题。现代语音识别系统严重依赖于云,在离线时可能就无法取得理想的工作效果。
阶段 | 年份 | 说明 |
---|---|---|
研究 | 1930 | 贝尔实验室提出语音分析合成系统模型( Homer Dudley ) |
1952 | 贝尔实验室的团队开发了用于识别说出的数字的系统Audrey (词表有大约10个词) | |
1960 | Gunnar Fant开发出用于产生语音的声源-过滤器模型( Source-filter model) | |
工程 | 1962 | IBM在1962年的西雅图世博会上展示Shoebox(词表有16个英语词) |
Late 1960 | 苏联研究者发明了动态时间规整(Dynamic Time Warping/DTW)(词表有200个词) | |
1971-1976 | DARPA资助了五年的语音识别研究,目标是将系统的词表扩展到1000词。CMU的Harpy 实现了这一目标,将词表扩展到了1011词 | |
Early 1980s | 隐马尔可夫模型(HMM)开始用于语音识别 | |
Mid 1980s | IBM的Tangora 将口语词表规模扩展到了20000词 | |
1987 | Katz开发了back-of模型(一种生成式n-gram语言模型) | |
应用 | 1990 | 第一款语音识别消费级产品Dragon Dictate发布 |
1993 | 黄学东开发出Sphinx(第一个大词表连续语音识别系统) | |
1996 | BellSouth 开发了第一个语音门户VAL,这是一种呼叫交互式语音识别系统 | |
1997 | Juergen 开发出长短期记忆(LSTM)网络,后被广泛运用于语音识别领域 | |
2002 | 微软开始将语音识别集成到他们的产品中 | |
2007 | 谷歌推出GOOG-411服务 | |
2008 | 谷歌为iPhone 推出语音搜索(Voice Search)应用 | |
2009 | Geoffrey Hinton、邓力、俞栋 etc.(多伦多大学、微软、谷歌、IBM)提出用于声学建模的深度前馈神经网络,显著提升了语言识别的准确度 | |
2010 | 谷歌在安卓手机上为Voice Search 引入[个性化识别]功能,让其可以记录不同用户的声音 | |
2011 | 苹果推出Siri | |
2012 | 谷歌推出Google Now | |
2014 | 微软发布Cortana | |
2012 | 亚马逊发布Echo(使用了Alexa) | |
2016 | 谷歌发布Google Assistant |
-
这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。
-
我们将这项技术归类到应用阶段,因为现在有很多应用都已经集成了基于文本挖掘的情绪分析或垃圾信息检测技术。文本挖掘技术也在智能投顾的开发中有所应用,并且提升了用户体验。
文本挖掘和分类领域的一个瓶颈出现在歧义和有偏差的数据上。
年份 | 说明 |
---|---|
1954 | BOW模型的早期引用出现 |
1955 | 语言模型出现 |
mid - 1980s | 隐马尔可夫模型用于POS消岐 |
1990s | 文本分析开始被称为[文本数据挖掘]或[文本挖掘] |
1998 | 出现隐语义索引(Latent Semantic Indexing)模型 |
1999 | Thomas Hofmann创造概率隐语义分析(pLSA)模型 |
2002 | Andrew Ng et al.开发出隐狄利克雷分布(LDA) |
2016 | 模型Facebook 研究团队开发出一个名叫fastText的库,可用于快速文本表征和分类 |
机器翻译(MT)是利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。
-
机器翻译是一个见证了大量发展历程的应用领域。该领域最近由于神经机器翻译而取得了非常显著的进展,但仍然没有全面达到专业译者的水平;但是,我们相信在大数据、云计算和深度学习技术的帮助下,机器翻译很快就将进入社会影响阶段。
在某些情况下,俚语和行话等内容的翻译会比较困难(受限词表问题)。
专业领域的机器翻译(比如医疗领域)表现通常不好。
阶段 | 年份 | 说明 |
---|---|---|
研究 | 1949 | Warren Weaver 提出了机器翻译的思想 |
1954 | IBM-701系统表现出了机器翻译的可能性 | |
Late 1950s,early1960s | Margaret Masterman et al.设计了用于机器翻译的语义网络 | |
工程 | 1976 | 蒙特利尔大学开发出TAUM-MTO系统,在翻译上取得了好的成绩,成为了这一领域的里程碑 |
1993 | Brown和Della Pietra开始将统计方法应用于机器翻译 | |
2003 | Koehn 提出基于短语的翻译模型;Yoshua Bengio的团队开发了一个基于神经网络的语言模型 | |
2005 | David Chang 提出基于层次短语的翻译 | |
应用 | 2006 | 谷歌推出谷歌翻译 |
2009 | IBM 开发出ViaVoice Translator | |
2014 | 不同团队的研究者都开发出了神经机器翻译(NMT);注意力机制也开始被引入神经机器翻译 |
-
机器人学(Robotics)研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理。
机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。
-
自上世纪[Robot]一词诞生以来,人们已经为工业制造业设计了很多机器人。工业机器人是增长最快的应用领域,它们在20世纪80年代将这一领域带入了应用阶段。在安川电机、Fanuc、ABB、库卡等公司的努力下,我们认为进入21世纪之后,机器人领域就已经进入了社会影响阶段,此时各种工业机器人已经主宰了装配生产线。此外,软体机器人在很多领域也有广泛的应用,比如在医疗行业协助手术或在金融行业自动执行承销过程。
但是,法律法规和[机器人威胁论],可能会妨碍机器人领域的发展。还有设计和制造机器人需要相对较高的投资。
阶段 | 年份 | 说明 |
---|---|---|
研究 | 1920/1921 | 艺术家Josef Capek创造了[Robotl这个词,并通过其兄弟Kar el Capek的一部戏剧将其介绍给公众 |
1941 | Isaac Asimov 提出[机器人三定律」 | |
工程 | 1948 | William Grey Walter 创造的Turtle 被认为是第一个自动的移动机器人 |
1954 | George Devol和Joe Engleberger 发明了第一个可编程的机器人——实际上是机器臂;通用(GM)在1961年买下了这个机器机器人 | |
1960s | Johns Hopkins Beast 移动式[前(pre-robot)]问世 | |
late 1960s | SRI开发出Shakey(第一个通用移动式机器人) | |
应用 | 1961 | 通用(GM)首次在装配线上安装了工业机器人Unimate |
1970s | 早期自动驾驶汽车Stanford Cart(Moravec)问世 | |
1990 | 世界上最成功的商业机器人吸尘器公司iRobot成立 | |
1995 | CMU改造了一辆旁蒂克Trans Sport 小型厢车,得到了自动汽车 NaMab 5,它完成了3100英里的行程 | |
1997 | 火星探路者号(NASA的一次火星任务,包含一个固定着陆器和一个移动火星车)成功在火星着陆 | |
社会影响 | 2004 | DARPA Ground Challenge 自动驾驶汽车挑战赛开始 |
2005 | STANLEY赢得DARPA挑战赛,完成了132英里行程 | |
2007 | 库卡推出KR ttan([世界上最大和最强的六轴工业机器]),是吉尼斯世界纪录中世界最强壮的机器人 | |
2009 | 谷歌启动自动驾驶汽车项目 | |
2016 | ABB 开发出YuMi世界上第一款真正的协作式工业机器人] | |
2017 | 机器人[Sophia]成为沙特阿拉伯公民,这是第一个获取公民身份的机器人 |
大多数早期技术至少已经处于应用阶段了,而且其中一些已经显现出了社会影响力。一些新开发的技术可能仍处于工程甚至研究阶段,但是我们可以看到不同阶段之间转移的速度变得越来越快。
人工智能主要分支【了解】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。