验证模型和调整后的R平方
嘿,社区,
我有一个关于我的模型验证的问题(我使用了交叉验证操作符)。
我创建了一个预测模型(标签:数值),因此使用了“线性回归”、“神经网络”和“深度学习”算法。为了验证,我选择了RMSE,相对误差和平方相关(R平方)。
我读到,选择的属性越多,R平方就越好。为了防止这种情况,我读到应该选择调整后的R平方。这是可能的与RapidMiner工作室或这是已经调整的R平方?
为了改进我的模型,我还使用“Select attributes”操作符进行了测试,并注意到以下内容:
当我选择所有属性时,我有这样的表现:
案例1
线性回归(RMSE 0,8 I相对误差14,2 I R平方0,63)
神经网络(RMSE 0,86 I RF 15,91 I R²0,65)
深度学习(RMSE 0,78 I RF 11,72 I R平方0,68)
在这种情况下,深度学习应该是最好的模型。
现在我删除了一些用于建模的属性,得到了以下结果:
案例2
线性回归(RMSE 0,79 I相对误差14,0 I R平方0,68)
神经网络(RMSE 0,89 I RF 17,29 I R²0,66)
深度学习(RMSE 0,79 I RF 13,19 I R平方0,65)
我真的不知道第二种情况下的线性回归是否比第一种情况下的深度学习模型更好(R平方变得更好,但相对误差变得更糟)。有人能帮帮我吗?
非常感谢!
我有一个关于我的模型验证的问题(我使用了交叉验证操作符)。
我创建了一个预测模型(标签:数值),因此使用了“线性回归”、“神经网络”和“深度学习”算法。为了验证,我选择了RMSE,相对误差和平方相关(R平方)。
我读到,选择的属性越多,R平方就越好。为了防止这种情况,我读到应该选择调整后的R平方。这是可能的与RapidMiner工作室或这是已经调整的R平方?
为了改进我的模型,我还使用“Select attributes”操作符进行了测试,并注意到以下内容:
当我选择所有属性时,我有这样的表现:
案例1
线性回归(RMSE 0,8 I相对误差14,2 I R平方0,63)
神经网络(RMSE 0,86 I RF 15,91 I R²0,65)
深度学习(RMSE 0,78 I RF 11,72 I R平方0,68)
在这种情况下,深度学习应该是最好的模型。
现在我删除了一些用于建模的属性,得到了以下结果:
案例2
线性回归(RMSE 0,79 I相对误差14,0 I R平方0,68)
神经网络(RMSE 0,89 I RF 17,29 I R²0,66)
深度学习(RMSE 0,79 I RF 13,19 I R平方0,65)
我真的不知道第二种情况下的线性回归是否比第一种情况下的深度学习模型更好(R平方变得更好,但相对误差变得更糟)。有人能帮帮我吗?
非常感谢!
0
答案
至于哪种模型是最好的,仅仅基于这些性能指标是没有简单的方法来回答这个问题的。您必须了解用例,才能理解相对误差略高与Rsq之间的权衡。它还可能有助于查看底层数据,以确定这种关系是否看起来应该是线性的。附加的特征工程可能有助于改善所有的模型拟合。
Lindon合资企业
乐鱼平台进入数据科学咨询由认证的RapidMiner专家