上海建设网站制作宁波网站的优化

张小明 2026/1/19 17:45:54
上海建设网站制作,宁波网站的优化,网站建设与网页设计实训报告,网红包装设计师NGBoost-shap方法回归任务#xff0c;由斯坦福吴恩达团队提出#xff0c;属于集成模型的一种2019年提出的#xff0c;算是比较新的方法了 自带数据集#xff0c;可以直接运行#xff0c;对模型采用shap进行分析#xff0c;所有图所见即所得 python 代码NGBoost这玩意儿最…NGBoost-shap方法回归任务由斯坦福吴恩达团队提出属于集成模型的一种2019年提出的算是比较新的方法了 自带数据集可以直接运行对模型采用shap进行分析所有图所见即所得 python 代码NGBoost这玩意儿最近在回归任务里挺火作为吴恩达团队整出来的新活它最骚的地方在于既能预测数值还能估计不确定性。咱们今天直接上手实操用自带数据集快速搞个可复现的demo顺带用SHAP把模型掰开了揉碎了看看。先装个环境别问问就是pip大法好pip install ngboost shap上代码直接开整先加载内置的糖尿病数据集from ngboost import NGBRegressor from sklearn.datasets import load_diabetes from sklearn.model_selection import train_test_split X, y load_diabetes(return_X_yTrue) X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42) ngb NGBRegressor(Distngboost.distns.Normal, n_estimators100) ngb.fit(X_train, y_train) # 预测时同时拿到预测值和置信区间 preds ngb.pred_dist(X_test) print(f均值预测示例{preds.params[loc][:3]}) print(f标准差示例{preds.params[scale][:3]})这里用了正态分布作为基分布n_estimators设到100能保证基础学习器足够多。预测结果直接返回分布参数比普通回归只能输出个数值有意思多了。接下来用SHAP扒开模型看细节import shap # 用TreeExplainer适配树模型结构 explainer shap.TreeExplainer(ngb) shap_values explainer.shap_values(X_test) # 特征重要性可视化 shap.summary_plot(shap_values, X_test, feature_namesload_diabetes().feature_names)运行后会跳出两张神图第一张是特征总体重要性明显能看到s5血清检测指标和age对预测结果影响最大第二张是特征作用方向图每个点颜色代表特征值大小能直观看到高年龄对应的预测值偏移方向。想具体看单个预测案例上force_plot# 选个有意思的样本观察 sample_idx 15 shap.force_plot(explainer.expected_value, shap_values[sample_idx], X_test[sample_idx], feature_namesload_diabetes().feature_names)这图看着就很有说服力——基线值在150左右s5特征硬生生把预测结果拉低了20个点bmi又给顶上去10个点。这种可视化比看表格里的系数值直观十个Level实测中发现NGBoost对参数挺敏感把Dist换成LogNormal分布预测区间立马变得右偏。SHAP分析时也会发现特征影响方向发生微妙变化这说明模型结构的选择会直接影响可解释性结果。建议跑多个分布配置对比着看特别是当业务场景对不确定性方向有要求时。最后来个骚操作把预测分布画出来看不确定性import matplotlib.pyplot as plt plt.figure(figsize(10,6)) plt.scatter(y_test, preds.params[loc], alpha0.5) plt.errorbar(y_test, preds.params[loc], yerr2*preds.params[scale], fmto, alpha0.3) plt.plot([y.min(), y.max()], [y.min(), y.max()], r--)这个误差带可视化直接暴露了模型在极端值区域的预测乏力——当真实值超过250时预测点明显偏离红色对角线同时误差带急剧变宽。这种双重可视化把模型优缺点直接拍脸上比单纯看R²得分带劲多了。总结下来NGBoostSHAP的组合拳特别适合需要量化不确定性的场景比如金融风控、医疗预测。代码层面几乎零魔改就能出效果但要注意分布假设对可解释性的影响。下次遇到产品经理说我要个能解释的AI直接甩这个方案过去就完事了。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网站删除模块企业公司简介范文

React 虚拟化的过度使用React 开发者似乎把虚拟化库(比如 react-window 和 react-virtualized)当成了渲染列表的万能药。从逻辑上看,这似乎很合理:用户一次只能看到 10 个项目,为什么要渲染全部 1000 个?虚…

张小明 2026/1/17 21:54:52 网站建设

手机网站app制作页面设计英文翻译

10分钟搞定AI语音克隆:GPT-SoVITS零基础完整指南 【免费下载链接】GPT-SoVITS 项目地址: https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS 想要快速制作属于自己的AI语音克隆模型吗?GPT-SoVITS让这一切变得前所未有的简单!这个一…

张小明 2026/1/17 21:54:53 网站建设

什么是网站国内高速空间10大营销理论

UPX可执行文件压缩技术深度解析:从原理到实践的应用指南 【免费下载链接】upx UPX - the Ultimate Packer for eXecutables 项目地址: https://gitcode.com/gh_mirrors/up/upx 在当今软件分发领域,文件大小直接影响着用户体验和分发效率。UPX&…

张小明 2026/1/17 21:54:55 网站建设

朝西村小江网站建设嘉祥做网站

智能家居通知系统终极指南:从零开始搭建完美提醒机制 【免费下载链接】home-assistant.io :blue_book: Home Assistant User documentation 项目地址: https://gitcode.com/GitHub_Trending/ho/home-assistant.io 你是否曾经因为错过智能设备的重要状态而懊恼…

张小明 2026/1/17 21:54:56 网站建设

传统旅行社如何建设网站网上购物的网站开发背景

Zookeeper与Kyuubi集成:大数据SQL网关的“协调艺术” 1. 引入:当SQL网关遇到“协调难题” 凌晨3点,某电商公司BI工程师小夏的手机突然震动——监控系统报警:“Kyuubi Server 192.168.0.101 宕机,BI报表生成失败”。 小夏揉着眼睛登录集群:昨天刚上线的Kyuubi单节点SQL…

张小明 2026/1/17 21:54:57 网站建设

网站在工信部备案查询网站品牌建设公司

如何快速掌握Figma中文插件:提升设计效率的完整指南 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma英文界面而苦恼?想要专注设计创作却受限于语言障…

张小明 2026/1/17 21:54:57 网站建设