前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

原创
作者头像
拓端
发布2023-08-21 21:54:42
1920
发布2023-08-21 21:54:42
举报
文章被收录于专栏:拓端tecdat拓端tecdat

全文链接:https://tecdat.cn/?p=33462

原文出处:拓端数据部落公众号

本文将关注R语言中的LASSO(Least Absolute Shrinkage and Selection Operator)惩罚稀疏加法模型(Sparse Additive Model,简称SPAM)。SPAM是一种用于拟合非线性数据的强大工具,它可以通过估计非线性函数的加法组件来捕捉输入变量与响应变量之间的复杂关系。

通过本文,我们将展示如何帮助客户在R语言中使用LASSO惩罚稀疏加法模型(SPAM)来拟合非线性数据,并进行相应的可视化分析。

本文提供了一个代码来设置、拟合和可视化加法模型。数值特征会自动使用样条基函数进行扩展。这个基本思想最早是由Ravikumar等人在2009年提出的,他们称之为SPAM,即稀疏加法模型。最初的提议涉及到组套索lasso惩罚,但grpreg的任何惩罚函数都可以代替。基本用法如下所示。

非线性数据:

image.png
image.png
代码语言:javascript
复制
dim(Data$X)
# [1] 1000   16

矩阵包含 16 个数字特征。

生成的对象是一个列表,其中包含扩展矩阵和分组分配,以及一些内部函数所需的元数据。使用具有三个自由度的自然三次样条曲线。

现在可以将扩展后的矩阵传递给 :grpreg()

代码语言:javascript
复制
fit <- grpreg

请注意,在这种情况下不必传递分组信息,因为分组信息包含在对象中。

代码语言:javascript
复制
plot_spline(fit,

偏残差也可包含在这些图中:

代码语言:javascript
复制
plot_splinpartial=TRUE)
image.png
image.png

默认情况下,这些图的居中值为 x(的平均值(其中 x表示正在绘制的特征)的平均值为零时,y值为零。另一种情况是,如果指定了plot_spline()x,则将绘制一幅纵轴代表模型预测值的曲线图,所有其他特征都固定为平均值:

代码语言:javascript
复制
plot_spline(fit, "V02, type='conditional')

在比较这两幅图时,请注意总体轮廓是相同的,唯一不同的是纵轴的值。下面是前 9 个系数的曲线图:

image.png
image.png
代码语言:javascript
复制
for (i in 1:9) ploline(fit
plot_all_6-1.png
plot_all_6-1.png

在生成模型中,变量 3 和 4 与结果呈线性关系,变量 1、2、5 和 6 呈非线性关系,而所有其他变量均不相关。稀疏加法模型很好地捕捉到了这一点。

进行交叉验证(默认情况下会绘制出使交叉验证误差最小的拟合结果):

代码语言:javascript
复制
cvfit <- cv.grp
plot_line
image.png
image.png

最后,这些工具还可用于生存模型和 glm 模型。在这里,所有绘图都以线性预测尺度返回,残差为偏差残差。


a-winning-strategy-for-growth-investors-at-a-time-of-uncertainty-1403128203-thumb-1536x1536.webp
a-winning-strategy-for-growth-investors-at-a-time-of-uncertainty-1403128203-thumb-1536x1536.webp

最受欢迎的见解

1.数据类岗位需求的数据面

2.探析大数据期刊文章研究热点

3.机器学习助推快时尚精准销售预测

4.用机器学习识别不断变化的股市状况—隐马尔科夫模型(HMM)的应用

5.数据聆听人民网留言板的那些“网事”

6.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析

7.用数据解读体育决策:挖掘体育赛事新价值

8.把握出租车行驶的数据脉搏

9.智能门锁“剁手”数据攻略

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 全文链接:https://tecdat.cn/?p=33462
  • 原文出处:拓端数据部落公众号
  • 非线性数据:
相关产品与服务
数据万象
数据万象(Cloud Infinite,CI)是依托腾讯云对象存储的数据处理平台,涵盖图片处理、内容审核、媒体处理、AI 识别、文档预览等功能,为客户提供一站式的专业数据处理解决方案,满足您多种业务场景的需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com