搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
2023面试高手
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Python pandas库159个常用方法使用说明_pythonpandas库用法
2
VCam虚拟摄像头_vcam替换了本地摄像头
3
蓝桥杯、编程考级、NOC、全国青少年信息素养大赛—scratch列表考点_全国青少年信息素养大赛scratch题型
4
数据结构-二叉树详解(原理+基本操作Java实现)_java设计一个二叉树类结构
5
Windows安全基础——Windows WMI详解
6
element-plus Table组件更新数据后表头消失的解决方法_element 多行表头固定列显示不出来头
7
计算机基础上机考试难吗,《计算机应用基础(网考)》“上机考试”答疑
8
Vue项目Axios配置不同baseUrl,请求不同服务器的接口_vue axios如何不依赖默认baseurl
9
javaweb-实验九-复盘_javaweb实验
10
MySQL锁机制_mysql 所类型 record
当前位置:
article
> 正文
LightGBM模型
作者:2023面试高手 | 2024-04-13 03:42:05
赞
踩
lightgbm模型
LightGBM
与XGBoost对比:
模型精度:两个模型相当
训练速度:LightGBM训练速度更快 => 1/10
内存消耗:LightGBM占用内存更小 => 1/6
特征缺失值:两个模型都可以自动处理特征缺失值
分类特征:XGBoost不支持类别特征,需要对其进行OneHot编码,而LightGBM支持分类特征
XGBoost
模型的复杂度:
模型复杂度 = 树的棵数 X 每棵树的叶子数量 X 每片叶子生成复杂度
每片叶子生成复杂度 = 特征数量 X 候选分裂点数量 X 样本的数量
LightGBM针对XGBoost的优化:
Histogram算法,直方图算法 => 减少候选分裂点数量
GOSS算法,基于梯度的单边采样算法 => 减少样本的数量
EFB算法,互斥特征捆绑算法 => 减少特征的数量
LightGBM = XGBoost + Histogram + GOSS + EFB
Histogram算法-减少分类算法
替代XGBoost的预排序算法
思想是先连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图,即将连续特征值离散化到k个bins上(比如k=255)
当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点
XGBoost需要遍历所有离散化的值,LightGBM只要遍历k个直方图的值
候选分裂点数量 = k-1
GOSS算法-减少样本数量:
Gradient-based One-Side Sampling,基于梯度的单边采样算法
思想是通过样本采样,减少目标函数增益Gain的计算复杂度
单边采样,只对梯度绝对值较小的样本按照一定比例进行采样,而保留了梯度绝对值较大的样本
因为目标函数增益主要来自于梯度绝对值较大的样本 => GOSS算法在性能和精度之间进行了很好的trade off
EFB算法-减少特征数量:
Exclusive Feature Bundling,互斥特征绑定算法
思想是特征中包含大量稀疏特征的时候,减少构建直方图的特征数量,从而降低计算复杂度
数据集中通常会有大量的稀疏特征(大部分为0,少量为非0)我们认为这些稀疏特征是互斥的,即不会同时取非零值
EFB算法可以通过对某些特征的取值重新编码,将多个这样互斥的特征绑定为一个新的特征
类别特征可以转换成onehot编码,这些多个特征的onehot编码是互斥的,可以使用EFB将他们绑定为一个特征
在LightGBM中,可以直接将每个类别取值和一个bin关联,从而自动地处理它们,也就无需预处理成onehot编码
具体可参考:
https://zhuanlan.zhihu.com/p/99069186
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/2023面试高手/article/detail/414236
推荐阅读
article
FPGA
GT
高速
接口
实现 4K@
60Hz
视频
HDMI2.0
工程
解决方案
,提供4套工程源码和技术...
FPGA
GT
高速
接口
实现 4K@
60Hz
视频
HDMI2.0
工程
解决方案
,提供工程源码和
技术支持
_gt
高速
收发器ph...
赞
踩
article
Python
Web:
Flask
异步
执行任务_
python
flask
异步
...
简介
Flask
是
Python
中有名的轻量级同步 web 框架,在一些开发中,可能会遇到需要长时间处理的任务,此时就...
赞
踩
article
STM32
GCC
编译器
.
ld
& .
s
文件
详细解析_.
ld
文件
...
STM32
GCC
编译器
.
ld
& .
s
文件
详细解析_.
ld
文件
.
ld
文件
...
赞
踩
article
大
数据
技术
原理与应用课程
实验报告
(
Hadoop
开发环境
配置
作业)_大
数据
技术
原理与应用
实验报告
...
大
数据
技术
原理与应用课程
实验报告
(
Hadoop
开发环境
配置
作业)_大
数据
技术
原理与应用
实验报告
大
数据
技术
原理与应用实验报...
赞
踩
article
【
Linux
】
进程
优先级
_
进程
优先级
linux
...
并发与并行不同,我们大部分人的电脑其实只有一个CPU,而
进程
通常会有多个,为了考虑资源分配等问题,每个
进程
都有自己的时间...
赞
踩
article
微软
2023届校
招
开始啦(文
内
有
内
推
方法)_如何拿到
微软
公司
的
内
推
资格...
帮助求职
的
同学进行
微软
校
招
的
内
推
_如何拿到
微软
公司
的
内
推
资格如何拿到
微软
公司
的
内
推
资格 ...
赞
踩
article
【
牛客
网】每天
刷题
--
第十天
_
牛客
网
刷题
...
一.以下程序段的输出结果为( )for(int i = 4; i > 1; i
--
) for(int j = 1; j ...
赞
踩
article
基于
SpringBoot
Vue
求职
招聘
系统...
开发语言:Java后端:
SpringBoot
+Mybatis-Plus前端:
Vue
+ElementUI +
Vue
...
赞
踩
article
【
软件测试
Python
自动化
】全网最全大厂
面试题
,
看完以后你就是面试官!_易
找到
合适
的
用户脚本 仅...
前言嗨咯 大伙
,
我是你们
的
笨蛋程序员为了让大家更好
的
理解和学习投入到
Python
自动化
来
找到
一份好
的
资料也是学习过程中
,
...
赞
踩
article
[
SQL
Server
玩转
Python
] 三.
SQL
Server
存储
过程
实现
Python
鸢尾花
决策...
本系列文章主要讲解
SQL
Server
2017实现
Python
数据
分析的文章,同时对比两者的优劣。前两篇文章主要讲解S...
赞
踩
article
Git
--06--
国内
访问
Git
hub
_
github
国内
...
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言前言https://www.freesion...
赞
踩
article
百度
apollo
7.0
感知代码分析_
apollo
障碍物
u010647296
...
百度
apollo
7.0
版本 感知代码分析 _
apollo
障碍物
u010647296
apollo
障碍物
u010647...
赞
踩
article
【多目标跟踪】
Darklabel
自定义
数据格式
---
视频
标注
_
darklabel
使用教程...
1.环境windowsDarkLabel2.准备(1)
标注
工具DarkLabel2.4.zip-深度学习文档类资源-CS...
赞
踩
article
Python
学习——K-
means
聚类_
from
sklearn
.
cluster
import
km...
K-
means
的用法有了
Python
真的是做什么都方便得很,我们只要知道我们想要用的算法在哪个包中,我们如何去调用就ok...
赞
踩
article
探索
Udacity
Nanodegree
项目
:
技术
学习新维度...
探索
Udacity
Nanodegree
项目
:
技术
学习新维度
项目
地址:https://gitcode.com/mi...
赞
踩
article
Maven
的
scope
详解...
maven 项目不同的阶段引入到classpath中的依赖是不同的,例如,编译时,maven 会将与编译相关的依赖引入c...
赞
踩
article
Git
指定<
e
m>版本
e
m><
e
m>克隆
e
m>_<
e
m>克隆
e
m> 固定<
e
m>版本
e
m>
e
...
git clon
e
-b v0.20.0 --d
e
pth=1 https://github.com/ub
e
r/cad
e
n...
赞
踩
article
阿里
云天池
金融
风控
Task1
-
赛题
理解_
金融
风控
阿里
天池...
一、
赛题
理解学习链接为:https://tianchi.aliyun.com/specials/activity/pro...
赞
踩
article
嵌入式
stm32
毕
设
项目
分享
50例(四)
_
stm32
毕
设有什么
项目
...
【单片机
毕
业设计
项目
分享
系列】
stm32
毕
设有什么
项目
【单片机...
赞
踩
article
云
上攻防-
云
原生
篇&
Docker
安全
&系统内核&版本
漏洞
&
CDK
自动利用&容器逃逸...
1、
云
原生
-
Docker
安全
-容器逃逸&内核
漏洞
2、
云
原生
-
Docker
安全
-容器逃逸&版本
漏洞
3、
云
原生
-
Docker
...
赞
踩
相关标签
fpga开发
音视频
4K 视频
GTH
HDMI2.0
flask
python
前端
stm32
单片机
嵌入式硬件
大数据
hadoop
linux
服务器
运维
进程优先级
microsoft
蓝桥杯
linq
p2p
c++
c语言
spring boot
vue.js