搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
PHP如何下载对应的XDebug版本_xdebug历史版本下载
2
HTML生日快乐代码 (粉色主题)(HTML5+CSS3+JS)520表白代码/七夕情人节网页/告白/求婚/生日快乐_生日快乐的链接代码
3
unity2d人物真实跳跃实现(RigidBody添加力的作用)_unity rigidbody2d.addforce()
4
matlab实现瑞利信道需要的步骤,瑞利信道Matlab仿真程序
5
ZooKeeper 集群最少要几台服务器,为什么?_zookeeper最少几台
6
css的主题,CSS主题切换
7
python网络编程之websocket_python websocket客户端
8
Vue3+element ui取消el-select下拉选边框_vue3中使用elementplus选择器的边框如何去掉
9
Java依赖管理-eclipse中使用maven_eclipse 管理java依赖项
10
数据预处理_对一个属性的所有遗漏的值军利用一个用零来填补这属于缺失数据处理中的什么
当前位置:
article
> 正文
Boosting原理及其应用_boosting算法应用
作者:盐析白兔 | 2024-02-17 01:11:30
赞
踩
boosting算法应用
一、背景
故事:
某男到医院就诊,医生亲切地问了一些该男的症状,最后得出结论:“医生说我怀孕了。。。”
血淋淋的故事告诉我们:
需要一个好的诊断器:根据病人的一系列症状,得出病人患的是什么病。
实际上,这是一个分类问题。
分类问题很常见:
1) 博客男女
2) OCR
3) 情感分类
4) 查询意图识别
5) 排序学习
6) 等等
文本分类算法:
1) Nave Bayes
2) Decision Tree
3) KNN
4) ANN
5) SVM
6) ME
7) ...
然而,事实是残酷的。直接寻找一个强分类器很困难。
弱 + … + 弱 ≈ 强
- 古语有云:三个臭皮匠,顶个诸葛亮。
- Finding many rough rules of thumb can be a lot easier and more effective than finding a single, highly prediction rule.
启发:
整合多个弱分类器,成为一个强大的分类器。这时候,集合分类器(Boosting, Bagging等)出现了。
二、Boosting原理
1. Boosting由来
Kearns & Valiant (1984)
PAC学习模型
提出问题:
1) 强学习算法:存在一个多项式时间的学习算法以识别一组概念,且识别的正确率很高。
2) 弱学习算法:识别一组概念的正确率仅比随机猜测略好。
3) 弱学习器与强学习器的等价问题。如果两者等价,只需找到一个比随机猜测略好的学习算法,就可以将其提升为强学习算法。
Kearns & Valiant (1989)
证明了弱学习器和强学习器的等价问题。
Schapire (1989)
第一个提出了一个可证明的多项式时间的Boosting算法。
Schapire, etc. (1993)
第一次把Boosting算法思想用于实际应用:OCR。
Freund & Schapire (1995)
AdaBoost算法。
2. Boosting思想
基本思想:
1) 先赋予每个训练样本相同的概率。
2) 然后进行T次迭代,每次迭代后,对分类错误的样本加大权重(重采样),使得在下一次的迭代中更加关注这些样本。
示例:
3. AdaBoost算法及分析
1) Base Setting
二元分类问题
训练数据:
(x1, y1), …, (xm, ym)
where xi∈X, yi∈Y={-1, +1}
Dt(i): 样本xi 在第t次迭代的权重
D1(i)=1/m
ht(X):弱学习器Ct训练得到的判别函数
ht:X->{-1, +1}
εt:ht(X)的错误率
2) 基本思路
a) 训练一系列弱学习器h1, h2, …, hT。
b) 在训练过程中,注重那些分类错误的样本。
c) 把训练出来的一系列弱学习器组合起来,每个弱学习器ht(X)都有一个相应的权重α t:
3)AdaBoost算法
弱学习器Ct的权重αt由第t次迭代决定
训练样本的分布权重Dt (i)在每一次迭代都会更新
弱学习器Ct的选择:
如果某次迭代的训练误差大于1/2,则抛弃,算法停止
算法在每次迭代都会更新样本的分布权重,在下一次迭代前会进行一次训练样本的重采样。
如何进行重采样?
可根据概率分布Dt(i)来采样。“轮盘赌”算法是其中一种比较简单、高效的方法。
“轮盘赌”算法
使用一个[0~1]随机数生成器
举例:如果随机数生成器生成0.525,则恭喜你,获得“康师傅冰红茶”一瓶;若生成0.91,则能获得宝马一部。
4) AdaBoost特性分析
特性1:
训练误差的上界,随着迭代次数的增加,会逐渐下降。
特性2:
AdaBoost算法即使训练次数很多,也不会出现过度拟合(over fitting)的问题。
三、应用
1. 文本分类
给定某篇文档,判别其所属类别
文档可能是某些网页,也可能是短文本(query,微博等)
应用很广
AdaBoost (weak learner: NB, C4.5等)
2. 排序学习
1) 排序问题
2) 排序模型
3) 根据训练样本的形式及损失函数分类:
a) Pointwise approach
Prank
McRank
b) Pairwise approach
RankBoost
Ranking SVM
RankNet
c) Listwise approach
ListNet
ListMLE
4) RankBoost算法
参考文献
[1] Richard O. Duda, etc. Pattern Classification.
[2] Bing Liu. Web Data Mining.
[3] Tom M. Mitchell. Machine Learning.
[4] Yoav Freund, Robert E. Schapire. A short Introduction to Boosting.
[5] Dong Lehong. Survey of Boosting.
[6] Li Hang. Learning to Rank
原文:
http://blog.chinaunix.net/uid-8695538-id-3130689.html
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
<
em
>px
em
>、<
em
>r<
em
>px
em
>
em
>、
em
以及<
em
>r
em
em
>
的
区别与用法
_
<
em
>r
em
em
> <
em
>r<
em
>px
em
>
em
>...
<
em
>px
em
>、<
em
>r<
em
>px
em
>
em
>、
em
以及<
em
>r
em
em
>
的
区别与用法
_
<
em
>r
em
em
> <
em
>r<
em
>px
em
>
em
><
em
>r
em
em
> <
em
>r<
em
>px
em
>
em
> <
em
>px
em
>、<
em
>r<
em
>px
em
>
em
>、
em
、re...
赞
踩
article
el
ementUI中
日期
插件如何设置
默认
日期
为当前
日期
el
-
date
-
picker
设置
默认
日期
方法...
场景:
el
-
date
-
picker
组件中设置
默认
日期
为当前
日期
方法html: <
el
-form-item lab
el
="...
赞
踩
article
问题解决:
Ubuntu
12.04在
vmware10
下无法进入
Unity
模式_
unity
is
ru...
解决
Ubuntu
12.04在
vmware10
下无法进入
Unity
的问题。_
unity
is
running
with
...
赞
踩
article
Unity
中贴图融合之
弹痕
融合_
unity
texturecoord
...
实现原理:将一张图片像素点融合到另一张图图片的指定位置上1.首先需要两张图片:一张是墙的图片,一张是
弹痕
贴图2.新建工程...
赞
踩
article
计算机
rapter
流程图
,
Raptor
设计
程序
流程图
并运行的具体
操作步骤
...
想知道
Raptor
怎么
设计
程序
流程图
吗?以下就是
Raptor
设计
程序
流程图
并运行的具体
操作步骤
,赶紧来看看吧,希望能帮助...
赞
踩
article
鸿蒙
小
案例
-你
画
我
猜...
harmonyos
小
案例
-你
画
我
猜鸿蒙
小
案例
-你
画
我
猜 鸿蒙
小
案...
赞
踩
article
Optimism
为
CQT
提供
价值
20
万美元的
生态系统
资助,以表彰其支持...
Covalent Network(
CQT
)对于
Optimism
跨链数据的增长产生了直接的影响,而这一值得关注的里程碑...
赞
踩
article
详解
对称
算法
、非
对称
算法
、签名...
对称
算法
是指加密和解密使用同一个密钥的
算法
,常见的
对称
算法
有DES、AES等。
对称
算法
适用于需要快速加密解密的场景,比如...
赞
踩
article
unity贴图_
full
rect
...
Texture(纹理)纹理:是Unity最基础的图片形式对Texture Type:图片类型。Default:纹理Nor...
赞
踩
article
OpenCVForUnity
(五)图像
线性
混合
_
opencv
for
unity
2.5
.6...
图片的融合在日常的图片的处理中算是比较常用的功能,这节课我们一起来学习一下他的工作机制和OpenCV给我们提供的接口。这...
赞
踩
article
那些好用过头
的
键盘
_网吧
一般
配
的
是
什么
轴
的
键盘
...
一个好看又耐用
的
键盘
_网吧
一般
配
的
是
什么
轴
的
键盘
网吧
一般
配
的
是
什么
轴
的
键盘
...
赞
踩
article
导入数据库结构出现错误
ERROR
1273 (
HY000
)
at
line
25
:
Unknown ...
把文件中的所有的
utf8mb4
_
0900
_
ai
_
ci替换为utf8
_
general
_
ci以及
utf8mb4
替换为utf8...
赞
踩
article
计算机
考
研是
英语
一
还是
英语
二
,2020
考
研|我是
考
英语
一
还是
英语
二
?如何判断......
现阶段2020的
考
研小伙伴们大多还处于摸索阶段,为了帮助大家更深入的了解
考
研事宜,今天给大家科普
一
下不同专业
英语
数学如何...
赞
踩
article
推荐优美
的
Pyqt
/
Pyside
界面
模板
_
pyside2
界面
美化...
分享一些积攒已久
的
比较美观
的
pyqt和pyside
界面
UI
模板
~_
pyside2
界面
美化
pyside2
界面
美化 ...
赞
踩
article
DL-Practise /
OpenSitUp
训练自己的数据集(关键点检测)_
valueerror
...
源码一、下载code建立虚拟环境:conda cre
at
e -n AI python = 3.8.5激活虚拟环境:act...
赞
踩
article
Shader
学习
12
——简易
图片
叠加
...
看到蛮牛有人想要两个带透明通道的
图片
叠加
,就是最简单的纹理混合,想想其实实现起来应该很简单,但是搜了一下还真没搜到,这里...
赞
踩
article
Unity
模型上
绘制
贴图
融合_
unity
怎么
绘制
多个
tilling
采样
多个
贴图
...
首先功能是在
Unity
中能在任意的模型上实现类似
unity
自带的地形系统里的
贴图
绘制
功能。能够支持最多4张自定义
贴图
的融...
赞
踩
article
利用
dpabi
整理医院原始扫描出
的
dicom
光盘
数据
时
的
小技巧及结果介绍
_
不是
有效
的
dicom
光盘
...
今天在用
dpabi
软件整理医院发来
的
mri
数据
时,遇到了小小
的
麻烦,就是发来
的
数据
是多级目录结构,存在很多配置文件和运行...
赞
踩
article
【
人工
智能
】未来三年(2018-2020),
我们
在
新一代
人工
智能
产业
能做什么_
我们
目前
面临着
一个
非常
...
国务院于2017年7月21日印发了《
新一代
人工
智能
发展规划》,提出了面向2030年我国
新一代
人工
智能
发展的指导思想、战略...
赞
踩
article
A
MULTI
-
MODALITY
FUSION
NETWORK
BASED
ON
ATTENTION
...
g∈R1×1×4。A
MULTI
-
MODALITY
FUSION
NETWORK
BASED
ON
ATTENTION
...
赞
踩
相关标签
css
vmware
ubuntu
unity
windows 8
操作系统
c#
unity3d
游戏
源码
鼠标
计算机rapter 流程图
harmonyos
华为
区块链
网络
服务器
安全
OpenCVForUnity
OpenCV图片融合
图片融合
线性混合
OpenCV线性混合
键盘