搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
我家自动化
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
使用Dockerfile创建docker镜像_dockerfile from images
2
(pytorch进阶之路)IDDPM之diffusion实现_improved diffusion怎么运行
3
常用的50个linux命令行_linux命令行大全
4
2024.1.8力扣每日一题——回旋镖的数量
5
linux下TCP/IP及内核参数优化调优(TIME_WAIT)_内核参数调优 加速timewait回收
6
若依框架(RuoYi-Vue):权限功能模块设计分析_若依框架权限控制
7
Flink DataStream API (十二)Flink 输出到 Kafka_add_sink( flinkkafkaproducer
8
springboot实现异步线程池并实现实时监控_异步框架如何监控
9
day21-java(改)
10
MATLAB 自定义优化模型_matlab优化模型
当前位置:
article
> 正文
Boosting原理及其应用_boosting算法及其应用
作者:我家自动化 | 2024-02-17 01:14:15
赞
踩
boosting算法及其应用
一、背景
故事:
某男到医院就诊,医生亲切地问了一些该男的症状,最后得出结论:“医生说我怀孕了。。。”
血淋淋的故事告诉我们:
需要一个好的诊断器:根据病人的一系列症状,得出病人患的是什么病。
实际上,这是一个分类问题。
分类问题很常见:
1) 博客男女
2) OCR
3) 情感分类
4) 查询意图识别
5) 排序学习
6) 等等
文本分类算法:
1) Nave Bayes
2) Decision Tree
3) KNN
4) ANN
5) SVM
6) ME
7) ...
然而,事实是残酷的。直接寻找一个强分类器很困难。
弱 + … + 弱 ≈ 强
- 古语有云:三个臭皮匠,顶个诸葛亮。
- Finding many rough rules of thumb can be a lot easier and more effective than finding a single, highly prediction rule.
启发:
整合多个弱分类器,成为一个强大的分类器。这时候,集合分类器(Boosting, Bagging等)出现了。
二、Boosting原理
1. Boosting由来
Kearns & Valiant (1984)
PAC学习模型
提出问题:
1) 强学习算法:存在一个多项式时间的学习算法以识别一组概念,且识别的正确率很高。
2) 弱学习算法:识别一组概念的正确率仅比随机猜测略好。
3) 弱学习器与强学习器的等价问题。如果两者等价,只需找到一个比随机猜测略好的学习算法,就可以将其提升为强学习算法。
Kearns & Valiant (1989)
证明了弱学习器和强学习器的等价问题。
Schapire (1989)
第一个提出了一个可证明的多项式时间的Boosting算法。
Schapire, etc. (1993)
第一次把Boosting算法思想用于实际应用:OCR。
Freund & Schapire (1995)
AdaBoost算法。
2. Boosting思想
基本思想:
1) 先赋予每个训练样本相同的概率。
2) 然后进行T次迭代,每次迭代后,对分类错误的样本加大权重(重采样),使得在下一次的迭代中更加关注这些样本。
示例:
仔细观察c1 c2 c3 最后一幅图是有前面图的
划分线拼凑而成
3. AdaBoost算法及分析
1) Base Setting
二元分类问题
训练数据:
(x1, y1), …, (xm, ym)
where xi∈X, yi∈Y={-1, +1}
Dt(i): 样本xi 在第t次迭代的权重
D1(i)=1/m
ht(X):弱学习器Ct训练得到的判别函数
ht:X->{-1, +1}
εt:ht(X)的错误率
2) 基本思路
a) 训练一系列弱学习器h1, h2, …, hT。
b) 在训练过程中,注重那些分类错误的样本。
c) 把训练出来的一系列弱学习器组合起来,每个弱学习器ht(X)都有一个相应的权重α t:
3)AdaBoost算法
弱学习器Ct的权重αt由第t次迭代决定
训练样本的分布权重Dt (i)在每一次迭代都会更新
弱学习器Ct的选择:
如果某次迭代的训练误差大于1/2,则抛弃,算法停止
算法在每次迭代都会更新样本的分布权重,在下一次迭代前会进行一次训练样本的重采样。
如何进行重采样?
可根据概率分布Dt(i)来采样。“轮盘赌”算法是其中一种比较简单、高效的方法。
“轮盘赌”算法
使用一个[0~1]随机数生成器
举例:如果随机数生成器生成0.525,则恭喜你,获得“康师傅冰红茶”一瓶;若生成0.91,则能获得宝马一部。
4) AdaBoost特性分析
特性1:
训练误差的上界,随着迭代次数的增加,会逐渐下降。
特性2:
AdaBoost算法即使训练次数很多,也不会出现过度拟合(over fitting)的问题。
三、应用
1. 文本分类
给定某篇文档,判别其所属类别
文档可能是某些网页,也可能是短文本(query,微博等)
应用很广
AdaBoost (weak learner: NB, C4.5等)
2. 排序学习
1) 排序问题
2) 排序模型
3) 根据训练样本的形式及损失函数分类:
a) Pointwise approach
Prank
McRank
b) Pairwise approach
RankBoost
Ranking SVM
RankNet
c) Listwise approach
ListNet
ListMLE
4) RankBoost算法
参考文献
[1] Richard O. Duda, etc. Pattern Classification.
[2] Bing Liu. Web Data Mining.
[3] Tom M. Mitchell. Machine Learning.
[4] Yoav Freund, Robert E. Schapire. A short Introduction to Boosting.
[5] Dong Lehong. Survey of Boosting.
[6] Li Hang. Learning to Rank.
原文:
http://blog.chinaunix.net/uid-8695538-id-3130689.html
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/我家自动化/article/detail/98585
推荐阅读
article
webview
是
什么东西_珍爱
生命
,
远离
安卓
WebView
...
2019.01.01 更新:解决方法2019.01.06 更新:另外一个同类型bug众所周知
,
安卓
的
WebView
是
个非...
赞
踩
article
unity
3d
-4.
地形
系统_
unity
terrain
layer
...
Terrain创建和编辑
地形
Create Neighbor TerrainsPaint TerrianRaise or ...
赞
踩
article
brats
数据
集
图像
分割
_水平
集
_
图像
分割
...
外文原址:https://wiseodd.github.io/techblog/2016/11/05/levelset-...
赞
踩
article
假期充电
,
用
阿里
云
Serverless
K8s +
AIGC
搭建私人代码助理_serverles...
AI 技术正在引领科技创新浪潮
,
随着 ChatGPT 和 Midjourney 的走红
,
AIGC
技术正在世界范围内掀起...
赞
踩
article
今年
是
收获与成长
的
一年
...
身边刚毕业
的
同事都很聪明,也
的
确非常优秀,很多都
是
高学历,印象最深
的
是
一位复旦大学
的
硕士跟我闲聊时说,他对很多东西都不感...
赞
踩
article
高校刮起
元
宇宙
风!
3DCAT
实时
云
渲染
助力
川轻化
元
校园
建设...
近日,四
川轻化
工大学李白河校区(以下简称“
川轻化
”)
元
校园
全新上线,该
元
宇宙
解决方案采用了
3DCAT
提供的
实时
云
渲染
服务...
赞
踩
article
【
Unity3d
】
自动
拼接
地型
板块
_
unity
地形
拼接
...
在手游中可以使用Unity的terrain系统,不过效率当前并不理想,还有一种方式是自己做地块。首先美术预制作一系列Pr...
赞
踩
article
【
ChatGPT
实战】12.一键
免费
部署
你的私人-
ChatGPT
-
网页
_
chatgpt
api ke...
正常来说搭建一个私人
ChatGPT
网页
需要一定的
网页
开发技术和费用。幸运的是,现在有一种简便的方法可以一键
免费
部署
你的私...
赞
踩
article
2022年
车工
(
技师
)
操作证
考试
题库及答案_
管理
事项
一般
包括劳动
管理
造价
管理
等...
题库来源:安全生产模拟
考试
一点通公众号小程序2022
车工
(
技师
)
考试
题模拟
考试
题库为
车工
(
技师
)理论题库全真模拟题!20...
赞
踩
article
Swagger
问题:No
mapping
for
GET
/
swagger
-
ui
.
html
报错...
简介:本文讲解No
mapping
for
GET
/
swagger
-
ui
.
html
这个报错的解决方法。只需要对Swag...
赞
踩
article
mac
os 安装
vue
cli
失败记录_
mac
安装
vue
cli
失败...
之前的电脑坏了,于是入手了一台mbp,在安装
vue
脚手架的时候提示错误如下:搜索后发现是因为没有权限,需要在命令前面添加...
赞
踩
article
ChatGPT
使用
总结:150个
ChatGPT
提示
词
模板
(
完整版
)...
chatGPT资源所有
提示
词
模板
功能列表如下_chatgpt
提示
词
chatgpt
提示
词
Chat...
赞
踩
article
Mac下
安装
vue
时报错:
bash
:
vue
:
command
not
found
_mac
vue
:
...
本人也是个小白,在Mac电脑上
安装
vue
时,报了如上错误,上网找各种原因,现在问题解决了。大量浏览网站发现原因是缺少系统...
赞
踩
article
分享一个在
python
中画
图
,
并在
图
中增加
网格线
和将
x
轴标签倾斜的小
程序
_
python
bar
图
...
如题目所述
,
分享一个在
图
中增加
网格线
,
并且将
x
轴标签倾斜的
python
小
程序
. 小
程序
的源码如下:from 翻译包 ...
赞
踩
article
鸿蒙
内核
--
剖析
API
_
osthreadterminate
...
华为设备认证笔记
内核
部分任务管理任务管理简介基本概念1、从系统的角度看,任务是竞争系统资源的最小运行单元。任务可以使用或...
赞
踩
article
unity
布料
自
碰撞_
Unity
基础教程
-物体运动(六)——更复杂的
重力
(
Planes
,Spher...
200+篇教程总入口,欢迎收藏:放牛的星星:[教程汇总+持续更新]
Unity
从入门到入坟——收藏这一篇就够了zhua...
赞
踩
article
Element
源码
系列
——初识
框架
_
element
是
框架
吗...
Element
-ui
源码
系列
——初识
框架
Element
-ui
源码
系列
——初识
框架
序言目录结构package.json1....
赞
踩
article
UIElements
开发人员指南5 Writing
UXML
Templates(编写
UXML
模板
)...
编写
UXML
模板
UXML
模板
是使用XML标记编写的文本文件,用于定义用户界面的逻辑结构。以下代码示例演示如何定义一个简单...
赞
踩
article
计算机
键盘
优点,
市面上
的
笔记本
键盘
优缺点
解析,看完秒懂!...
原标题:
市面上
的
笔记本
键盘
优缺点
解析,看完秒懂!大家在选购电脑时,很多人的关注重点都是
笔记本
的配置好不好、外观设计酷不酷...
赞
踩
article
【
资源
大全】.
NET
资源
大全
中文版
(
Awesome
最新版
)
...
算法与数据结构
(
Algorithms and Data structures
)
应用程序接口
(
API
)
应用程序框架
(
App...
赞
踩
相关标签
webview是什么东西
webview硬件加速导致fragment切换闪屏
安卓 fragment内显示网站
安卓打开第二个activity就崩溃
unity
brats数据集图像分割
阿里云
云计算
serverless
java
3d
图形渲染
unity3d
地型
自动拼接
chatgpt
人工智能
机器人
安全
ui
html
前端
macos
npm