在泰坦数据集上预测int。

VenomSwitchVenomSwitch 成员职位:5贡献我
2020年3月编辑 帮助
请原谅我的理解水平新手,我是全新的。
我正试图用交叉验证和线性回归来预测泰坦尼克号数据集上的死亡率。由于只能在线性回归中使用数字,所以我使用“名义到数字”操作符转换了选定的属性(如幸存)。我可以看到它在大多数时间都是有效的,从观察数据和四舍五入到1或0,但预测值返回为双精度,所以它显示为0正确的预测。

我想我的问题是我如何使rapidminer返回int而不是double?我尝试过使用“实数到整数”操作符,但它不喜欢我把它放在任何地方!
欢迎任何建议。
Jasmine_

最佳答案

答案

  • VenomSwitchVenomSwitch 成员职位:5贡献我
    2020年3月编辑
    当我说“双重”时,我实际上是指“真实”。
    Jasmine_
  • VenomSwitchVenomSwitch 成员职位:5贡献我
    嗨,马丁,

    太棒了,GLM正是我所需要的!
    我想要整数,因为它给了我小数点的值,因为它们不完全匹配幸存列中的'1'/'0',它只是告诉我每一个都是错误的,准确率为0%(因为它没有四舍五入到数据集中的'1'/'0'格式)。
    我不知道在哪里放置生成属性操作符,但这并不重要,因为GLM已经解决了我的问题。

    一个非常熟练的操作员。

    干杯!
    乔尔
    (删除用户) Jasmine_
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    你可以把它放在你使用的每个apply model操作符之后。很好,GLM起作用了。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
    Jasmine_ VenomSwitch
  • VenomSwitchVenomSwitch 成员职位:5贡献我
    我已经让它工作,但现在它似乎有100%的准确率,这似乎是可疑的。我只是要坚持我之前思考过的GLM流程!如果它没坏,就别修了,哈哈。
    不过你今天帮了我大忙!笑脸:

    Jasmine_
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    您确定将舍入应用于预测而不是label属性吗?这就解释了:)
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
    VenomSwitch Jasmine_
  • VenomSwitchVenomSwitch 成员职位:5贡献我
    这是我目前使用线性回归而不是GLM生成属性的过程。
    我的标签是“幸存=是”。
    我尝试在cross-val内部使用相同的操作符,但同样的结果;100%正确的预测。
    Jasmine_
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    那么另一个想法,你确定幸存=否不是训练的一部分吗?这也解释了为什么会有这么好的结果
    欢呼,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
    Jasmine_
登录注册置评。