搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
繁依Fanyi0
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
iOS-申请邓白氏编码的超详细流程介绍_ios邓白氏编码签名授权
2
计算机网络三:运输层_以太网运输层协议
3
使用JAXB实现JavaBean与XML互相转换
4
git多平台多账号公钥配置_公钥的邮箱必须跟账号的邮箱一致吗
5
开发小程序需要服务器吗?小程序服务器配置要求_上门小程序 服务器配置
6
20203年 Java 面试题集锦(金三银四)_金三银四java面试通关题集
7
最简单/最详细/手把手/windows11升级教程
8
面向视频的全新AI架构 —— 阿里云智能视觉技术全解_多路视频自由定制ai视觉任务技术架构
9
快速获取到微信小程序源码(反编译)_微信开发者工具的 程序源文件在哪
10
git 修改远程仓库链接地址_git 如何更改远程链接
当前位置:
article
> 正文
读十堂极简人工智能课笔记06_自然语言处理
作者:繁依Fanyi0 | 2024-04-23 22:31:29
赞
踩
读十堂极简人工智能课笔记06_自然语言处理
1. 聊天机器人
1.1. 人工智能往往掌握不了跨越几段对话语境的讨论
1.1.1. 抓不住连贯的主题,只能单独处理每个句子
1.1.2. 不能将其答案与现实联系起来
1.1.3. 可能会遵循语言规则、统计相关性,甚至查找有关事实来为每个新句子提供答复
1.2. 聊天机器人只是在模拟对话
1.2.1. 操纵着符号,却不了解这些符号的含义
1.2.2. 约翰·塞尔的中文房间论证
1.3. 哲学家深刻地关心真实性的问题,但商业世界并不关心
1.3.1. 对商界来说,重要的是结果,而不是产生这个结果的过程
1.4. 在现实世界的应用中
1.4.1. 一个能自动提供在线客户服务的聊天机器人
1.4.2. 一个能利用产品知识数据库回答客户问题的聊天机器人
1.4.3. 企业必不可少的工具
1.4.3.1. 能让真人腾出手来处理难度更大的咨询
2. 语言规则
2.1. 在自然语言处理领域,诺姆·乔姆斯基是其发展史上的关键人物
2.1.1. 美国语言学家、哲学家
2.1.2. 认知科学领域(关于思维及其能力的科学研究)的创始人之一
2.1.3. 最著名的一大成果是通用语法
2.1.3.1. 在研究儿童的语言能力发展后总结出来的理论
2.1.3.2. 儿童虽然能够学会流利地说话,但他们在学习过程里其实根本没有接收到足够的信息
2.1.3.2.1. 所谓的“刺激的贫乏”
2.1.3.3. 儿童能够发展语言技能的唯一途径是他们拥有先天的沟通能力,在他们的大脑中本来就有相关的连接
2.1.3.4. 先天的语言能力可以被认为是一套语言规则,即一套通用语法
2.1.3.5. 这一想法发展为转换——生成语法的理论,也就是使用“形式语法”来描述嵌入不同语言中的规则,让人们能够比较这些语言
2.1.3.6. 这一思想在20世纪50至70年代主导了语言学,而这正是人工智能研究者开始尝试让计算机处理文字的时候
2.2. 乔姆斯基的层级结构
2.2.1. 所有形式化语法都是第0型,或无限制型(最一般的类型)
2.2.2. 只有一部分第0型语法同时也是第1型
2.2.2.1. 上下文敏感型
2.2.2.2. 这类词根据上下文可能只适合放在某个地方
2.2.3. 只有一部分第1型语法同时也是第2型
2.2.3.1. 上下文自由型
2.2.3.2. 大多数计算机编程语言的设计方式
2.2.3.3. 语句中不能有任何歧义
2.2.4. 只有一部分第2型语法同时也是第3型
2.2.4.1. 其定义的规则语言是如此简单和狭窄,以至于有限状态机都可以理解它们
2.3. 自然语言处理就是聊天机器人内部的符号人工智能
2.3.1. 目的是弄清怎么处理书面文字
2.4. 早期的聊天机器人广泛使用了乔姆斯基的理论,人们可以据此开发出清晰而精确的语言规则
2.5. 正是通过自然语言处理,研究人员现在可以将成千上万互相独立的科学论文整合对照,得出人类无法实现的新发现
3. 语料库语言学
3.1. 随着世界上越来越多的知识、商业活动和社交互动转移到互联网上,人类之间对话的数据量也有了指数级增长
3.2. 这些数据的第一个用途,是通过一种叫作决策树的人工智能方法,自动生成语言规则
3.3. 决策树流行的原因是,它们很容易理解
3.3.1. 与神经网络方法不同的是,神经网络像“黑箱”
3.3.1.1. 你不知道信息是如何存储的,也不知道决策是如何做出的
3.3.2. 在决策树中,你可以看清整个过程
3.3.2.1. 决策树就像用于机器人控制的行为树
3.4. 过度拟合
3.4.1. 人工智能学到的模型过于贴合训练数据,而不能泛化应用到新数据上
3.5. 随机森林就是把一组决策树结合在一起使用,每一个决策树都是在较小的数据子集上训练出来的,以防止过度拟合
3.6. Word2Vec
3.6.1. 目前最受欢迎的方法之一
3.6.2. 使用简单的神经网络与大量的数据来学习哪些词语的组合倾向于出现在彼此靠近的地方
3.6.3. 可以从一组上下文词汇中预测中间的词可能是什么
3.6.4. 从一个中间的词预测一组可能的上下文词汇
3.7. 卷积神经网络、强化学习和其他类型的循环神经网络、递归神经网络、注意力机制和生成模型,这都有助于计算机理解跨越多个句子的概念,并生成更好的回复
4. 交流
4.1. 人类毕竟是社会动物,我们喜欢交谈
4.1.1. 我们喜欢把字眼安排在无限变化的句子中,每个句子的含义都略有不同
4.2. 人工智能能理解文字已经难能可贵
4.2.1. 苹果的Siri、微软的Cortana、亚马逊的Echo和谷歌的Assistant都是人类现有的最复杂算法的组合
4.3. 用于交流的人工智能并不总是特别可靠
4.3.1. 只要问它们一些意想不到的问题,或者用系统没有训练过的口音提问,即使是精巧的技术也会失败
4.4. 机器不可能总是听清每个声音
4.4.1. 人工智能会将初始的理解修正为人们更有可能说出来的话语
4.4.2. 毕竟大多数人每天都会说很多相同的话
4.5. 除了几百万美元的云计算成本外,它们的碳足迹可能与五辆汽车的整个生命周期一样高
4.6. 虽然人工智能技术在训练结束后的应用可能会很高效,但创造人工智能的过程并不高效或便宜
4.7. 人工智能的许多最新研究都忽视了效率问题
4.7.1. 因为人们发现规模极大的神经网络对多种多样的任务都很有用,那些拥有丰富计算资源的公司和机构可以利用这一点来获得竞争优势
4.8. Tay
4.8.1. 2016年3月23日推出
4.8.2. 微软在2016年探索过一个方案:利用众包来提供数据,帮助他们的推特聊天机器人学习
4.8.3. 仅仅16个小时后就被匆忙关闭
4.8.4. 网友教给Tay各种粗话和与毒品相关的语句,然后它顺理成章地把这些语句推送给了众多关注者
4.9. 伪装成人类的聊天机器人可以给我们发送一些具有针对性的广告或政治信息
4.10. 舆论意见可以由此被监测和管理
4.11. 我们获取信息的方式也是由人工智能策划的
4.12. 推荐系统会监测我们在移动设备上喜欢阅读哪些内容,并向我们推送更多类似的内容,让我们看到的世界变得更加狭窄,由此进一步加强我们的偏见
4.12.1. 那些不受欢迎的政权更容易控制人民,民粹领袖也更容易赢得权力
4.13. 通过人工智能,才可以真正了解千百万人民的意见和看法,并帮助政治家和机构更好地满足人民的需求
4.14. 所有的新技术都可能被用于为善或作恶
4.14.1. 我们需要意识到人工智能的影响,并确保它得到恰当的应用
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/476321
推荐阅读
article
人工智能
、深度
学习
、机器
学习
常见
面试题
21
~40
_
人工智能
考研
面试题
...
目录
21
.如何进行特征选择?22.为什么会产生过拟合,有哪些方法可以预防或克服过拟合?23.用 EM 算法推导解释 Km...
赞
踩
article
编程
、
Web
前端
/后端、
游戏
开发
、
嵌入式
开发
、大
数据
、
人工智能
、机器学习需要什么样的
笔记本
配置?(2...
转自 知乎
编程
、
Web
前端
/后端、
游戏
开发
、
嵌入式
开发
、大
数据
、
人工智能
、机器学习需要什么样的
笔记本
配置? - 知乎 (...
赞
踩
article
大
数据
毕业设计
Python+
Spark
知识
图谱
酒店
推荐
系统
酒店
评论情感分析
酒店
价格预测
系统
酒店
...
基于协同过滤的方法主要是通过分析用户的历史行为和其他用户的行为,找出与目标用户兴趣相似的其他用户,然后根据这些相似用户的...
赞
踩
article
毕业设计
选题
-基于
深度
学习
的
鸟类
识别目标检测系统
人工智能
机器
学习
卷积
神经网络
_传统的
鸟类
监测方...
毕业设计
选题
:基于
深度
学习
的
鸟类
识别检测算法系统的研究。该系统利用先进的计算机视觉技术和
深度
学习
算法,旨在实现准确和高效...
赞
踩
article
毕业设计
选题-
计算机
视觉
:复杂场景下的车牌
识别系统
人工智能
深度学习
YOLO
_有关
计算机
视觉
的毕...
毕业设计
选题-
计算机
视觉
:复杂场景下的车牌
识别系统
利用先进的图像处理和机器学习算法,能够准确地检测和识别车辆的车牌号码,...
赞
踩
article
毕业设计
:基于
深度
学习
的
垃圾
识别
分类系统
人工智能
...
毕业设计
:基于
深度
学习
的
垃圾
识别
分类系统通过结合
深度
学习
和计算机视觉技术,该系统能够从大量的图像数据中
学习
垃圾
的特征,并...
赞
踩
article
毕业设计
:基于深度
学习
的垃圾图像分类
人工
智能
python
_基于deeplearning的图片
智能
...
毕业设计
:基于深度
学习
的垃圾图像分类通过结合深度
学习
和计算机视觉技术,我们提出了一种创新的方法来解决垃圾分类的问题。我们...
赞
踩
article
毕业设计
:基于
深度
学习
的生活
垃圾
识别
与
分类
系统 CNN
人工智能
...
毕业设计
:基于
深度
学习
的生活
垃圾
识别
与
分类
系统通过利用
深度
学习
算法和计算机视觉技术,我们可以构建一个高效、准确的
垃圾
分类
...
赞
踩
article
大数据
毕业设计
OpenCV
异常
行为
检测系统 基于视频的个体
行为
分析系统
深度
学习
机器
学习
人工智能
...
大数据
毕业设计
OpenCV
异常
行为
检测系统 基于视频的个体
行为
分析系统
深度
学习
机器
学习
人工智能
PyTorch
T...
赞
踩
article
读书笔记
摘自:《
人工
智能
:国家
人工
智能
战略
行动
抓手》的笔记(作者: 腾讯研究院 中国信息通信研究院...
序言一第三次
人工
智能
浪潮已经到
来
,这是更强大的计算能力、更先进的算法、大
数据
、物联网等诸多因素共同作用的结果。决策让渡将...
赞
踩
article
人工智能
AI项目
ROUGE
评估算法简记
_
rougel
...
优点: 不要求词的连续匹配, 只要求按词的出现顺序匹配即可, 能够像n-gram一样反应句子级别的词序. 自动匹配最长公...
赞
踩
article
人工智能
(
pytorch
)搭建模型20-基于
pytorch
搭建
文本
生成
视频
的
生成
对抗网络,
技术创新
点...
大家好,我是微学AI,今天给大家介绍一下
人工智能
(
pytorch
)搭建模型20-基于
pytorch
搭建
文本
生成
视频
的
生成
...
赞
踩
article
【
人工智能
】之深入了解
嵌入
模型
中的
Token
:
NLP
中的语义之旅(1)_大
语言
模型
token
嵌入
...
在
NLP
中,文本数据被分割成最小的处理单元,这就是 “
token
”。
Token
可以是一个单词、一个子词,甚至是一个...
赞
踩
article
人工智能
-
Dlib
+
Python
实现
人脸
识别(
人脸
检测以及68点特征提取)_
dlib
提取
人脸
特征...
是一个现代的C ++工具包,包含机器学习算法和工具,用于在C ++中创建复杂的软件来解决实际问题。它广泛应用于工业界和学...
赞
踩
article
人工智能
-
目标
检测
:
发展
历史、
技术
全解与实战_
目标
检测
使用
的
人工智能
技术
怎么写...
本文全面回顾了
目标
检测
技术
的演进历程,从早期的滑动窗口和特征提取方法到深度学习的兴起,再到YOLO系列和Transfor...
赞
踩
article
人工智能
:
RNN
及
自然语言
处理
入门理解
与
综述(三)_
自然语言
处理
收获
与
体会...
与
图像
处理
一样,
自然语言
也是一个信息编码
与
解码的过程。机器将输入的
自然语言
数据中结构、含义和效用的不确定性消除,转化为它...
赞
踩
article
【
人工智能
】
机器
学习
算法
综述及
常见
算法
详解...
机器
学习
算法
是一种基于数据和经验的
算法
,通过对大量数据的
学习
和分析,自动发现数据中的模式、规律和关联,并利用这些模式和规...
赞
踩
article
云
计算
、
大
数据
、
人工智能
、
物
联网
、
虚拟现实
技术
、
区块
链
技术
(新一代信息
技术
)学习这一篇够了!_畅想未...
这是私有
云
的核心特征。这就需要智能处理
技术
了。
区块
链提供的去中心化的完全分布式 DNS 服务通过网络中各个节点之间的点对...
赞
踩
article
c/c++
人工智能
框架
和库_能
开发
ai
的c++
开发
平台
有哪些...
值得推荐的C/C++
框架
和库 C++资源大全关于 C++
框架
、库和资源的一些汇总列表,内容包括:标准库、Web应用
框架
...
赞
踩
article
人工智能
(
AI
)
领域
最
流行
的八大算法概括...
4. 生成对抗网络
(
GAN,Generative Adversarial Network
)
1. 卷积神经网络
(
CNN,C...
赞
踩
相关标签
人工智能
深度学习
机器学习面试题
人工智能面试
其他
大数据
课程设计
毕业设计选题
毕业设计
毕设
卷积神经网络
计算机视觉
YOLO
机器学习
目标检测
python