利用SHAP解释Xgboost模型 | 就是愛看書
SHAP是由Shapleyvalue启发的可加性解释模型。对于每个预测样本,模型都产生一个预测值,SHAPvalue就是该样本中每个特征所分配到的数值。假设第 ...
利用SHAP解释Xgboost模型(清晰版原文点这里[1])Xgboost相对于线性模型在进行预测时往往有更好的精度,但是同时也失去了线性模型的可解释性。所以Xgboost通常被认为是黑箱模型。
2017年,Lundberg和Lee的论文[2]提出了SHAP值这一广泛适用的方法用来解释各种模型(分类以及回归),其中最大的受益者莫过于之前难以被理解的黑箱模型,如boosting和神经网络模型。
本教程中,我们在真实数据集上进行实操,利用SHAP来解释Xgboost模型。
预计学习用时:30分钟。
本教程基于Python 3.6版本、Xgboost 0.82版本以及shap 0.28.5版本。
原创者:东布东[3] | 修改校对:SofaSofa TeamM |
1. Feature importance在SHAP被广泛使用之前,我们通常用feature importance或者partial dependence plot来解释xgboost。 feature importance是用来衡量数据集中每个特征的重要性。
简单来说,每个特征对于提升整个模型的预测能力的贡献程度就是特征的重要性。(拓展阅读:随机森林、xgboost中feature importance[4],Partial Dependence Plot是什么意思?[5],怎么利用permutation importance来解释xgboost模型[6])
Feature ...
Day 27 | 就是愛看書
Explain Your Machine Learning Model by SHAP. (Part 1) | 就是愛看書
利用SHAP解释Xgboost模型 | 就是愛看書
机器学习模型可解释性进行到底—— SHAP值理论(一) | 就是愛看書
模型解释–SHAP Value的简单介绍 | 就是愛看書
SHAP演算法程式碼細節請教(Linear、Tree、Kernal) | 就是愛看書
《Shapes》凱撒琳 978-957-506-216-3 (平裝, 36面, 20X21公分)
《Shapes》好看嗎?作者authorFelixHong由「凱撒琳」出版,ISBN:978-957-506-216-3(平裝,36面,20X21公分),以下為此書詳細...