Kotu和Deshpande 2015年教科书中的线性回归示例

洁西洁西 成员职位:2新手
2020年8月编辑 帮助
你好,

我是RapidMiner的新手。我试图遵循教科书“预测分析和数据挖掘:RapidMiner的概念和实践”(2015)中p172-179 Ch5的线性回归步骤。教科书很旧了,这可能是执行这个动作的过时方法。

不幸的是,我对社区太陌生了,不能发布过程的图像,但如果你搜索“图5.10”。设置一个过程来做未见数据和模型预测值之间的比较”,截图在科学直接页面的右下角返回。

我不能开始工作的步骤是最后一个生成属性步骤。创建一个属性来计算预测值和实际值之间的差值。然后查看该差异的直方图以检查其分布。

课本上说输入公式:(predictedMEDV-MEDV)
当我查看函数表达式输入列表时,这两个都被列为“特殊属性”

运行该进程时,我收到的错误是:“属性MEDV未知”。
当我查看示例集时,MEDV字段不显示。
但是,当我查看Generate Attributes操作符上的输入端口时,我可以看到MEDV字段有一个“预测”标签。

任何建议吗?
谢谢

ETA:我最终为原始数据集生成了一个ID,并在最后连接到这个ID,因此我可以将原始属性与预测属性进行比较


标记:

答案

  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    我建议不要在Generate Attribute中输入公式,而是单击“calculator”,您将能够从列表中选择属性来构建公式。这样你就可以避免犯错误。雅各
    lionelderkrikor
  • 洁西洁西 成员职位:2新手
    由于雅各。我也试过这个,但它只是没有工作,即使属性是可用的点击。在另一个不同的过程中,我试图再次生成残差,它工作得很好,所以我真的不确定为什么这个特殊的过程不会工作。没关系,我只是把它作为一个例子,试着遵循书上的内容。谢谢你的回复
  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    @jacyRapidMiner自Kotu和Deshpande的版本以来已经改变了很多,例如,当您在公式中使用预测属性时,RapidMiner不再“混淆”。你可能想要做的是看看这本书的第二版,也是经过大量改进的版本,现在被称为“数据科学:概念和实践”,我强烈推荐这本书。乐鱼平台进入我在教学中使用了这两个版本,我对两个版本中的例子都很满意。祝你好运!雅各
登录注册置评。