我希望以前没有人问过我的问题。简而言之,RapidMiner Go似乎正在运行与我没有选择的变量的回归。下面是解释。在Rapid Miner Go中,我删除了一个有64列和近2900行的csv文件。我想使用线性回归和决策树(“易于解释”)预测单列(数字)。前两列是日期和时间。其他列是数字。我只选择了5个输入,页面上的指示器显示已选择了5个。我运行了回归,在数据度量中,它报告了我选择的5个输入加上我没有选择的7个输入的相关性。假设我没有选择7个输入来运行回归,我如何只用我选择的5个输入来运行回归? Thanks very much. Regards, Bill
1
评论
你能反复检查模型是否建立在你选择的基础之上吗?您可以在模型链接执行后单击它,然后向下滚动以查看有多少带有系数的属性。
系数检查:
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
在Rapidminer Go中,一旦你点击之前通知的模型链接。在右上角有一个“导出”选项。如果你点击它,你会看到一个名为“下载过程”的选项。你能下载那个流程文件并附在这里检查吗?
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
谢谢分享。我会看一看,如果可能的话,试着在这里或在私人信息中分享你的数据,这样我就可以重新运行并向你解释他的现象的原因。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
没问题,让我们保留这个问题,因为我想让RM的朋友检查一下,也许可以开一个票来解决这个逗号问题。我不确定是否已经有一个说明,说我们不能在属性名中使用逗号,但我会等待这个问题得到解决,这样就不会有任何人未来的问题。
@sgenzer这里有输入吗?
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
为了重复此错误,请将此CSV文件上传到RapidMiner GO,并选择“角度”作为下图中的预测变量和属性(没有逗号),并在下一个窗口中使用默认选择,易于解释,并将所有内容保留为默认值并运行分析。
一旦分析完成,我们可以观察到GLM模型也使用了未选择的属性,如下所示。
观察到的原因与属性名中“,”逗号的存在有关。我的理解是REGEX函数存在于加载和处理数据-->删除列模块被这个逗号值欺骗了。一旦从属性名中去掉逗号,我就看不到这个了。此外,在属性名中使用逗号,就不会在auto模型中发生这种情况。
我不确定是否有指令不使用逗号在属性名称。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离