搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
从前慢现在也慢
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
大盘点!22项开源NeRF、SLAM顶会方案整理!(上)_slam nerf
2
数据结构实训(Java实验一 线性表-顺序表的基本操作)_顺序表实验报告java
3
[数据结构]单链表(C语言版)_单链表c语言
4
【研发日记】Matlab/Simulink避坑指南(十一)——Delay周期Bug
5
mysql 函数定义常量_php如何定义一个自定义常量
6
Jan AI本地运行揭秘:首次体验,尝鲜科技前沿_jan ai技术
7
HTTP协议安全机制_http协议通过哪些机制来确保通信的安全性
8
gitee创建新分支并提交新分支代码_gitee创建分支
9
架构师权威指南-后端架构师技术图谱_后端架构师职业调研
10
git reset命令--soft、--mixed、--hard的区别_git reset --mixed
当前位置:
article
> 正文
统计自然语言处理书籍阅读心得四_自然语言处理 读书报告
作者:从前慢现在也慢 | 2024-05-01 18:21:37
赞
踩
自然语言处理 读书报告
1:困惑度:
我们通常用困惑度(perplexity)来代替交叉熵 衡量语言模型的好坏。同样,语言模型设计的任务就是寻找困惑度最小的模型,使其最接 近真实语言的情况。在自然语言处理中,我们所说的语言模型的困惑度 通常是指语言模型对于测试数据的困惑度。一般情况下将所有数据分成 两部分,一部分作为训练数据,用于估计模型的参数;另一部分作为测 试数据,用于评估语言模型的质量。
2:噪声信道模型
其目标就是优化噪声信道中信号传 输的吞吐量和准确率,其基本假设是一个信道的输出以一定的概率依赖 于输入。一般情况下,在信号传输的过程中都要进行双重性处理:一方 面要对编码进行压缩,尽量消除所有的冗余;另一方面又要通过增加一 定的可控冗余以保障输入信号经过噪声信道传输以后可以很好地恢复原 状。这样,信息编码时要尽量少占用空间,但又必须保持足够的冗余以 便能够检测和校验传输造成的错误。信道输出信号解码后应该尽量恢复 到原始输入状态。过程如下图:
3:支持向量机
支持向量机(support vector machine, SVM)〔1〕是近几年来发展起 来的新型分类方法,是在高维特征空间使用线性函数假设空间的学习系 统,在分类方面具有良好的性能。近几年来,支持向量机在模式识别、 知识发现等理论研究,计算机视觉与图像识别、生物信息学以及自然语 言处理等相关技术研究中得到了广泛应用。在自然语言处理中,SVM广 泛应用于短语识别、词义消歧、文本自动分类和信息过滤等方面。
3-1:线性分类:
通过执行如下操作进行:当f(x)≥0 时,将输入x=(x1,x2,…,xn)′赋予正类,否则,将其赋予负类。当 f(x)(x∈X)是线性函数时,f(x)可以写成如下形式:
其实就是一个线性函数,如果他的值>0那么此时他的自变量是正类。该分类方法的几何解释是,方程式〈w·x〉+b=0定义的超平面将 输入空间X分成两半,一半为负类,一半为正类,如图2-5所示:
可以理解为图2-5中的黑斜线表示超平面当b的值变化时,超平面平行移动。因此,如果想表达 中所有 可能的超平面,一般要包括n+1个可调参数的表达式。如果训练数据可以被无误差地划分,那么,以最大间隔分开数据的 超平面称为最优超平面,如图2-6所示。
目前个人理解的是,先用两条平行线使正负集分隔开同时时这两条线之间距离最大,然后最优超平面就是这两条线中间的那条平行线。
3-2:线性不可分:
建立非线性分类器需要分两步:首先使用一个非线性映射函数将数据变换到一个特征空间F,然后在这个特征空间上使用线性分类器。线性分类器的一个重要性质是可以表示成对偶形式,这意味着假设 可以表达为训练点和线性组合,因此,决策规则(分类函数)可以用测 试点和训练点的内积来表示:
其中,l是样本数目;αi是个正值导数,可通过学习获得;yi为类别标 记。如果有一种方法可以在特征空间中直接计算内积,就像在原始输入点的函数中一样,那么,就有可能将两个步 骤融合到一起建立一个非线性分类器。这样,在高维空间内实际上只需 要进行内积运算,而这种内积运算是可以利用原空间中的函数实现的, 我们甚至没有必要知道变换的形式。这种直接计算的方法称为核 (kernel)函数方法。
3-3:核函数的构造:
核是一个函数K,对所有x, z∈X,满足:
其中
是从X到(内积)特征空间F的映射。
同时核函数要适合某个特征空间必须是对称的,即
并且需要满足
但是,这些条件对于保证特征空间的存在是不 充分的,还必须满足Mercer定理的条件,对X的任意有限子集,相应的 矩阵是半正定的。也就是说,令X是有限输入空间,K(x, z)是X上的 对称函数。那么,K(x, z)是核函数的充分必要条件是矩阵
是半正定的(即特征值非负)。
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
Codeforces
Round
887 (
Div
.
2
)
题解
||A+B...
首先是题目大致的意思是给你一个长度为N的整数序列,他去使用一个操作去使整个序列不是排序的,整个操作可以概括为选取一个下标...
赞
踩
article
SpringCloudAlibaba
:2.
nacos
...
Nacos是阿里巴巴开源的服务注册中心以及配置中心Nacos=注册中心Eureka + 服务配置Config + 服务总...
赞
踩
article
点亮
技能
I
人机
对话
系统
全面
理解
_
对话
系统
的
发展...
最近针对NLP
的
人机
对话
系统
方向作了学习,首先从底层技术NLP
理解
其工作原理,再了解基本
的
智能搜索、
对话
交互、问答匹配技...
赞
踩
article
meavn
sqlserver
使用_
sqlserver
mvn...
<dependencies> <dependency> <groupId>co...
赞
踩
article
基于
Vue
.
js
图书
管理系统
的设计与实现_
vue
.
js
参考文献
...
主要包括首页、个人中心、用户管理、
图书
分类管理、
图书
信息管理、
图书
资讯管理、在线客服、新
图书
上市管理、系统管理、订单管理...
赞
踩
article
2024
全球
机器
学习
技术
大会
上海站圆满闭幕,共奏
AGI
变革时代
!...
大模型为整个计算产业链带来的计算范式、开发范式、交互范式共三大范式转换,将深刻影响计算产业的未来,包括基础设施、开发流程...
赞
踩
article
浅谈车载
测试
之
智能
座舱
人机交互
_
智能
座舱
测试
面试题...
自动驾驶是汽车与环境的互动,人与人的互动是人与汽车的互动,两者融为一体,完成人、车、环境三者的协同,形成完整的驾驶闭环。...
赞
踩
article
Ollama
教程——
生成
内容
API
:利用
Ollama
的原生
API
进行AI应用开发_
ollama
ap...
在深入探讨
ollama
的
API
接口之前,让我们先了解一下
API
接口的基本概念及其在软件开发中的作用。
API
,或称应用程序...
赞
踩
article
免费可用
chartGPT
网站汇总
_
chartgpt
在线
网页...
支持文心4.0、智谱等国内大语言模型,以及gpt4.0等主流大模型)国内可以直连,响应速度很快 很稳定 [点击访问](h...
赞
踩
article
白话
机器
学习
2:快速理解
不同
分类
模型
...
快速理解
不同
分类
模型
,无数学公式白话
机器
学习
2:快速理解
不同
分类
模型
一、支持向量机(SVM) ...
赞
踩
article
JVM
垃圾
回收
的时候如何确定
垃圾
?什么是
GC
Roots
?_
垃圾
回收
如何判断是gc
root
...
GC
RootDemo.java/* * 在java中可作为
GC
Roots
的对象有: * 1.虚拟机栈(栈帧中的局部变量...
赞
踩
article
NLP
实战
:利用
Python
理解
、分析和
生成
文本
| 赠书...
导读:本文内容参考自《自然语言处理
实战
:利用
Python
理解
、分析和
生成
文本
》一书,由Hobson Lane等人所著。本...
赞
踩
article
Github
学生包
认证+Di
git
alOcean_di
git
alcean
git
学生包
...
https://blog.csdn.net/adminpd/article/details/80834887https:...
赞
踩
article
【
FPGA
/
verilog
-入门学习1】
verlog
中的
BUFGCE
,
BUFGMUX
原语...
它有I0和I1两个输入,一个控制端S,一个输出端O。当S为低电平时输出时钟为I0,反之为I1。需要指出的是
BUFGMUX
...
赞
踩
article
【
Spring
AI
】03.
图像
生成
API
-
Open
AI
...
Spring
AI
项目定义了一个名为 spring.ai.openai.api-key 的配置属性,您应该将其设置为从...
赞
踩
article
22
年阿里
Java
面试
题大解密,肝完这些
知识点
去
面试
成功率高
达90%...
即使是
面试
跳槽,那也是一个学习的过程。只有全面的复习,才能让我们更好的充实自己,武装自己,为自己的
面试
之路不再坎坷!今天...
赞
踩
article
基于
PCIE4C
的
数据传输
(三)——
使用
遗留
中断
与
MSI
中断
...
本文继续基于
PCIE4C
IP核实现主机(RHEL 8.9)与FPGA(Xilinx Ultrascale+HBM VC...
赞
踩
article
【
算法
】
字典
序超详细解析
(
让你
有
一种
相见恨晚
的
感觉!)...
经常刷
算法
题
的
朋友,肯定会经常看到题目中提到
字典
序 这样
的
字眼,或者需要我们通过
字典
序来解题,由于之前对
字典
序了解
的
不...
赞
踩
article
机器
学习
模型
可以
存储
吗?怎么储存?_j
机器
学习
模型
训练完的参数如何
保存
...
机器
学习
模型
可以
存储
以供后续使用。在
机器
学习
中,
模型
是通过对训练数据进行训练和优化得到的,它捕捉了数据中的模式和规律。一...
赞
踩
article
ZYNQ
实验 基于
LWIP
的
UDP
传输
实验_sdk
lwip
和
uart
...
* 基本参数设置 */2500//udp
传输
来的指令存放数组//收到的数据长度//GIC 中断管理/* 开发板MAC地址...
赞
踩
相关标签
算法
c++
数据结构
云服务
人机对话
NLP
AI产品
meavn
sql server
vue.js
前端
javascript
mysql
图书商城
机器学习
agi
人工智能
集成测试
软件测试
功能测试
职场和发展
面试
chatgpt
分类
支持向量机