搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
2023面试高手
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【数据库】关系模型介绍+形式化关系查询语言_数据库 附加关系模型
2
java web开发(学习路线)_javaweb学习路线
3
上百个高质量ChatGPT Prompts 精选_stable diffusion的提示工程师
4
如何从GitHub上面下载Java项目,并用IDEA导入该项目跑起来?_idea怎么打开github上下载的项目
5
Python远程连接Ubuntu20.4下的Mariadb数据库进行操作_ubuntu mariadb
6
如何对正射影像DOM(卫星影像、无人机航拍影像)进行拼接、合并以及去黑边(附 Global Mapper Pro 24.0 安装包(中文注册版))_正射影像拼接
7
JDK8、JDK11、JDK17和JDK21这几个版本更新的主要特性
8
【腾讯音乐笔试题汇总】[全网首发]-2024-03-28-腾讯音乐春招笔试题-三语言题解(CPP/Python/Java)_2024腾讯音乐笔试
9
数据仓库系列(三)数仓分层的意义价值及如何设计数据分层_数仓的分仓处理
10
hbase 集成 phoenix 实现 sql 化
当前位置:
article
> 正文
LightGBM模型
作者:2023面试高手 | 2024-04-13 03:42:05
赞
踩
lightgbm模型
LightGBM
与XGBoost对比:
模型精度:两个模型相当
训练速度:LightGBM训练速度更快 => 1/10
内存消耗:LightGBM占用内存更小 => 1/6
特征缺失值:两个模型都可以自动处理特征缺失值
分类特征:XGBoost不支持类别特征,需要对其进行OneHot编码,而LightGBM支持分类特征
XGBoost
模型的复杂度:
模型复杂度 = 树的棵数 X 每棵树的叶子数量 X 每片叶子生成复杂度
每片叶子生成复杂度 = 特征数量 X 候选分裂点数量 X 样本的数量
LightGBM针对XGBoost的优化:
Histogram算法,直方图算法 => 减少候选分裂点数量
GOSS算法,基于梯度的单边采样算法 => 减少样本的数量
EFB算法,互斥特征捆绑算法 => 减少特征的数量
LightGBM = XGBoost + Histogram + GOSS + EFB
Histogram算法-减少分类算法
替代XGBoost的预排序算法
思想是先连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图,即将连续特征值离散化到k个bins上(比如k=255)
当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点
XGBoost需要遍历所有离散化的值,LightGBM只要遍历k个直方图的值
候选分裂点数量 = k-1
GOSS算法-减少样本数量:
Gradient-based One-Side Sampling,基于梯度的单边采样算法
思想是通过样本采样,减少目标函数增益Gain的计算复杂度
单边采样,只对梯度绝对值较小的样本按照一定比例进行采样,而保留了梯度绝对值较大的样本
因为目标函数增益主要来自于梯度绝对值较大的样本 => GOSS算法在性能和精度之间进行了很好的trade off
EFB算法-减少特征数量:
Exclusive Feature Bundling,互斥特征绑定算法
思想是特征中包含大量稀疏特征的时候,减少构建直方图的特征数量,从而降低计算复杂度
数据集中通常会有大量的稀疏特征(大部分为0,少量为非0)我们认为这些稀疏特征是互斥的,即不会同时取非零值
EFB算法可以通过对某些特征的取值重新编码,将多个这样互斥的特征绑定为一个新的特征
类别特征可以转换成onehot编码,这些多个特征的onehot编码是互斥的,可以使用EFB将他们绑定为一个特征
在LightGBM中,可以直接将每个类别取值和一个bin关联,从而自动地处理它们,也就无需预处理成onehot编码
具体可参考:
https://zhuanlan.zhihu.com/p/99069186
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/2023面试高手/article/detail/414236
推荐阅读
article
《
硅谷
钢铁
侠:
埃隆
·
马斯克
的
冒险
人生
》成就21世纪
的
史诗_
硅谷
钢铁
侠:
埃隆
·
马斯克
的
冒险
人生
...
一般企业
的
面试题目,是要求软件工程师现场写十几行代码来解决问题;而SpaceX
的
标准面试题目则需要工程师写500行甚至更...
赞
踩
article
基于
微信
小
程序
的
核酸
检测
系统
源码
_医疗
检测
小
程序
源码
...
大等于jdk1.8,大于mysql5.5,idea(eclipse),
微信
开发者工具。代码注释齐全,没有多余代码,适合学...
赞
踩
article
30
个
Python
小游戏
,
小白练手项目
,
我能玩一天!【内附
源码
】_
python
简单
小游戏
代码...
今天给大家带来
30
个
python
小游戏
,
一定要收藏!_
python
简单
小游戏
代码
python
简单
小游戏
代码 ...
赞
踩
article
编程
知识不错的
博客
网站
推荐
_
编程
博客
网站
...
1、掘金:https://juejin.im/2、简书:https://www.jianshu.com/3、CSDN:h...
赞
踩
article
生成
模型(自
编码器
、
VAE
、
GAN
)_
latent
representation
...
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》,中间结合李沐的一个精读视频(GA...
赞
踩
article
完美运营版
商城
/拼团/团购/秒杀/积分/砍价/实物
商品
/
虚拟
商品
等
全功能
商城
...
(购买本专栏可免费下载栏目内所有资源不受限制,持续发布中,需要注意的是,本专栏为批量下载专用,并无法保证某款源码或者插件...
赞
踩
article
图像分类】【
深度
学习
】【轻量级网络】【
Pytorch
版本】
EfficientNet
_V2模型算法详解...
图像分类】【
深度
学习
】【轻量级网络】【
Pytorch
版本】
EfficientNet
_V2模型算法详解_efficient...
赞
踩
article
涨知识!用
Python
实现
植物
大战
僵尸
代码
...
作者 | marble_xu责编 | 毛中政出品 | CSDN博客功能介绍最近一直在给这个
植物
大战
僵尸
游戏添加新的
植物
和...
赞
踩
article
AI
Agent
s
综述
论文读后总结,附一些关于
Agent
System的脑洞_
agent
综述
...
关于
AI
Agent
s的研究,有两篇
综述
性文章值得关注,可以说是涵盖了目前
AI
Agent
s的所有研究成果,对于对此领域...
赞
踩
article
这份
Github
上
40K
+
star
面试
笔记
肝完,大厂
offer
还不是手到擒来?...
按照上面的过程,4个月的时间刚刚好。当然Java的体系是很庞大的,还有很多更高级的技能需要掌握,但不要着急,这些完全可以...
赞
踩
article
要学习使用的安全
工具
_
yasca
工具
下载
链接
...
要学习使用的安全
工具
_
yasca
工具
下载
链接
yasca
工具
下载
链接
最近在开始学习一些安全
工具
...
赞
踩
article
预处理
、
编译
、
汇编
、链接_
预处理
编译
汇编
链接...
C语言的
编译
链接过程要把我们编写的一个c程序(源代码)转换成可以在硬件上运行的程序(可执行代码),需要进行
编译
和链接。编...
赞
踩
article
2024
年
京东
云
服务器
超值开
年
优惠
,
只需
50
元
!...
2024
年
京东
云
服务器
优惠
价格表
,
轻量
云
主机2C2G3M价格
50
元
一
年
、196
元
三
年
、5.8
元
1个月
,
2C4G5M轻量
云
...
赞
踩
article
[1268]
Git
分支
管理
及
命名
规范
_
git
分支
管理
规则...
代码库有且仅有一个主
分支
,所有提供给用户使用的正式版本,都在这个主
分支
上发布。
Git
默认主
分支
Master,它是自动建立...
赞
踩
article
【
Python
】成功解决
TypeErr
or
:
list
indices
must be intege...
【
Python
】成功解决
TypeErr
or
:
list
indices
must be integers
or
slic...
赞
踩
article
TP5
手动集成
GatewayWorker
_
gatewayworker
tp
...
Workerman是一款纯PHP开发的开源高性能的PHP socket 服务器框架,而
GatewayWorker
则是基于...
赞
踩
article
在
Windows
电脑上
上传
iOS
应用至
App
Store
...
通过本文的介绍,我们了解了在
Windows
电脑上
上传
iOS
应用至
App
Store
的详细步骤。尽管在操作上存在一些限制,...
赞
踩
article
GitHub
上13个高赞
Java
项目
推荐,会一个就能跟
面试官
谈笑风生
_
java
比较好
的
项目
...
支持单选题、多选题、判断题支持学生(student)、教师(teacher)、管理员(admin)三种角色学生:参加考试...
赞
踩
article
大
数据
风控
必看,挖掘
学历
数据
中暗藏的
还款
意愿及
还款
能力_
银行
系统
能查到员工
学籍
吗...
市场上80%以上的信贷产品或信用卡,在申请人填写基本信息时都会需要填写
学历
情况,
银行
信用卡部门还会根据
学历
等级来设置进件...
赞
踩
article
物
联网
实战
--
驱动篇之(五)
TEA
和
AES
加密算法
...
简单介绍
AES
和
TEA
加密算法
,以及如何应用,阐述
物
联网
的安全性
物
联网
实战
--
驱动篇之(五)
TEA
和
AES
加密算法
...
赞
踩
相关标签
程序人生
马斯克
传记
职场和发展
读书
java
spring boot
mybatis
计算机毕业设计
微信小程序
python
pygame
开发语言
python小游戏
python实战
python入门
python练手项目
生成对抗网络
人工智能
自编码器
VAE
生成模型
商城源码
小程序商城源码
深度学习