当前位置:   article > 正文

ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略_随机森林和shap结合作预测

随机森林和shap结合作预测

ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之详细攻略

目录

基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性

 # 1、定义数据集

# 2、数据预处理

# 2.1、分离特征与标签

# 3、模型建立和训练

# 3.1、数据集切分# 3.2、模型训练

# 4、模型特征重要性解释可视化

# 4.1、单个样本基于shap值进行解释可视化

# (1)、挑选某条样本数据并转为array格式

# (2)、利用Shap值解释RFC模型

    # T1、基于树模型TreeExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)

    # T2、基于核模型KernelExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)

# 4.2、多个样本基于shap值进行解释可视化

# (1)、基于树模型TreeExplainer创建Explainer并计算SHAP值

# (2)、全验证数据集样本各特征shap值summary_plot可视化

# (3)、依赖关系贡献图dependence_plot可视化


相关文章
ML:机器学习可解释性之SHAP值之理解单样本单特征预测
ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略
ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略实现

相关文章
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现

基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性

 # 1、定义数据集

数据集来源Dataset:FIFA 2018 Statistics数据集(Predict FIFA 2018 Man of the Match预测2018年国际足联最佳球员)的简介、下载、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客

DateTeamOpponentGoal ScoredBall Possession %AttemptsOn-TargetOff-TargetBlockedCornersOffsidesFree KicksSavesPass Accuracy %PassesDistance Covered (Kms)Fouls CommittedYellow CardYellow & RedRedMan of the Match1st GoalRoundPSOGoals in PSOOwn goalsOwn goal Time
14-06-2018RussiaSaudi Arabia54013733631107830611822000Yes12Group StageNo0
14-06-2018Saudi ArabiaRussia0606033212528651110510000NoGroup StageNo0
15-06-2018EgyptUruguay043833201737839511212200NoGroup StageNo0
15-06-2018UruguayEgypt1571446451133865891116000Yes89Group StageNo0
15-06-2018MoroccoIran06413364501428643310122100NoGroup StageNo0190

# 2、数据预处理

# 2.1、分离特征与标签

  1. df_X Goal Scored Ball Possession % Attempts ... Yellow & Red Red Goals in PSO
  2. 0 5 40 13 ... 0 0 0
  3. 1 0 60 6 ... 0 0 0
  4. 2 0 43 8 ... 0 0 0
  5. 3 1 57 14 ... 0 0 0
  6. 4 0 64 13 ... 0 0 0
  7. [5 rows x 18 columns]
  8. df_y 0 True
  9. 1 False
  10. 2 False
  11. 3 True
  12. 4 False
  13. Name: Man of the Match, dtype: bool

# 3、模型建立和训练

# 3.1、数据集切分
# 3.2、模型训练

# 4、模型特征重要性解释可视化

# 4.1、单个样本基于shap值进行解释可视化

# (1)、挑选某条样本数据并转为array格式

  1. 输出当前测试样本:5
  2. Goal Scored 2
  3. Ball Possession % 38
  4. Attempts 13
  5. On-Target 7
  6. Off-Target 4
  7. Blocked 2
  8. Corners 6
  9. Offsides 1
  10. Free Kicks 18
  11. Saves 1
  12. Pass Accuracy % 69
  13. Passes 399
  14. Distance Covered (Kms) 148
  15. Fouls Committed 25
  16. Yellow Card 1
  17. Yellow & Red 0
  18. Red 0
  19. Goals in PSO 3
  20. Name: 118, dtype: int64
  21. 输出当前测试样本的真实label: False
  22. 输出当前测试样本的的预测概率: [[0.29 0.71]]

  1. 输出当前测试样本:7
  2. Goal Scored 0
  3. Ball Possession % 53
  4. Attempts 16
  5. On-Target 4
  6. Off-Target 10
  7. Blocked 2
  8. Corners 7
  9. Offsides 1
  10. Free Kicks 20
  11. Saves 1
  12. Pass Accuracy % 77
  13. Passes 466
  14. Distance Covered (Kms) 107
  15. Fouls Committed 23
  16. Yellow Card 1
  17. Yellow & Red 0
  18. Red 0
  19. Goals in PSO 0
  20. Name: 35, dtype: int64
  21. 输出当前测试样本的真实label: False
  22. 输出当前测试样本的的预测概率: [[0.56 0.44]]

# (2)、利用Shap值解释RFC模型

    # T1、基于树模型TreeExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)

 

    # T2、基于核模型KernelExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)

 

# 4.2、多个样本基于shap值进行解释可视化

# (1)、基于树模型TreeExplainer创建Explainer并计算SHAP值

# (2)、全验证数据集样本各特征shap值summary_plot可视化

# (3)、依赖关系贡献图dependence_plot可视化

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/285539
推荐阅读
相关标签
  

闽ICP备14008679号