MATLAB偏最小二乘法回归:模型、离群点检测与变量选择

全文下载:http://tecdat.cn/?p=22319

最近我们被客户要求撰写关于PLS的研究报告,包括一些图形和统计输出。

本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点和只使用所选变量的子集来 "清洗 "你的数据。

步骤

  • 建立PLS回归模型
  • PLS的K-折交叉验证
  • PLS的蒙特卡洛交叉验证(MCCV)。
  • PLS的双重交叉验证(DCV)
  • 使用蒙特卡洛抽样方法进行离群点检测
  • 使用CARS方法进行变量选择。
  • 使用移动窗口PLS(MWPLS)进行变量选择。
  • 使用蒙特卡洛无信息变量消除法(MCUVE)进行变量选择
  • 进行变量选择

建立PLS回归模型

这个例子说明了如何使用基准近红外数据建立PLS模型。

参数设定

pls.m函数返回一个包含成分列表的对象PLS。结果解释。

regcoef_original:连接X和y的回归系数。 X_scores:X的得分。 VIP:预测中的变量重要性,评估变量重要性的一个标准。 变量的重要性。 RMSEF:拟合的均方根误差。 y_fit:y的拟合值。 R2:Y的解释变异的百分比。

PLS的K折交叉验证

说明如何对PLS模型进行K折交叉验证

返回的值CV是带有成分列表的结构数据。结果解释。

RMSECV:交叉验证的均方根误差。越小越好 Q2:与R2含义相同,但由交叉验证计算得出。 optLV:达到最小RMSECV(最高Q2)的LV数量。

点击标题查阅相关内容

R语言中的偏最小二乘回归PLS-DA

左右滑动查看更多

01

02

03

04

蒙特卡洛交叉验证(MCCV)的PLS

说明如何对PLS建模进行MCCV。与K-fold CV一样,MCCV是另一种交叉验证的方法。

相关视频

**

拓端

,赞26

MCCV是一个结构性数据。结果解释。

Ypred:预测值 Ytrue:真实值 RMSECV:交叉验证的均方根误差,越小越好。 Q2:与R2含义相同,但由交叉验证计算得出。

PLS的双重交叉验证(DCV)

说明如何对PLS建模进行DCV。与K-fold CV一样,DCV是交叉验证的一种方式。

使用蒙特卡洛抽样方法的离群点检测

说明离群点检测方法的使用情况

结果解释。

predError:每个抽样中的样本预测误差 MEAN:每个样本的平均预测误差 STD:每个样本的预测误差的标准偏差

注:MEAN值高或SD值高的样本更可能是离群值,应考虑在建模前将其剔除。

使用CARS方法进行变量选择。

结果解释。

optLV:最佳模型的LV数量 vsel:选定的变量(X中的列)。

注:在这幅图中,顶部和中间的面板显示了选择变量的数量和RMSECV如何随着迭代而变化。底部面板描述了每个变量的回归系数(每条线对应一个变量)如何随着迭代而变化。星形垂直线表示具有最低RMSECV的最佳模型。

使用移动窗口PLS(MWPLS)进行变量选择

注:从该图中建议将RMSEF值较低的区域纳入PLS模型中。

使用蒙特卡洛无信息变量消除法(MCUVE)进行变量选择

结果解释。RI:UVE的可靠性指数,是对变量重要性的测量,越高越好。

进行变量选择

结果解释:

模型结果是一个矩阵,储存了每一个相互关系中的选择变量。 概率:每个变量被包含在最终模型中的概率。越大越好。这是一个衡量变量重要性的有用指标。

本文摘选 《 Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择 》 ,点击“阅读原文”获取全文完整资料。

点击标题查阅往期内容

R语言实现偏最小二乘回归法 partial least squares (PLS)回归 R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归R语言Lasso回归模型变量选择和糖尿病发展预测模型 R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析 Python贝叶斯回归分析住房负担能力数据集 Python用PyMC3实现贝叶斯线性回归模型 R语言区间数据回归分析 R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测 PYTHON用时变马尔可夫区制转换(MRS)自回归模型分析经济时间序列 R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析 基于R语言实现LASSO回归分析 Python用PyMC3实现贝叶斯线性回归模型 使用R语言进行多项式回归、非线性回归模型曲线拟合 R语言中的偏最小二乘回归PLS-DAR语言生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素 R语言实现偏最小二乘回归法 partial least squares (PLS)回归 Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择 偏最小二乘回归(PLSR)和主成分回归(PCR) R语言如何找到患者数据中具有差异的指标?(PLS—DA分析)

QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空