关于其中一个教程的问题

wclasterwclaster 委员、大学教授职位:43大学教授
在第一个教程中,叫做“入门”。在第4/5节中,在泰坦尼克训练数据集上建立最简单的决策树之后,在执行这个过程之后,在教程中它说
“伟大的工作!你的过程现在应该完成了,并提供了一个决策树模型,它向你解释了大多数幸存者和大多数受害者的共同点。”

实际上,我不太明白他们指的是什么。仅仅从看那棵树(见附件),他们的意思是什么
幸存者(或受害者)有什么共同之处?
我不知道他们是怎么从树上读到这些的。显然这是显而易见的,因为他们没有解释,但我不明白。谢谢你!

最好的答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3357年RM数据科学家
    解决方案接受
    @wclaster
    我想我们改变了一个默认参数。如果您将min_gain设置为0.1而不是0.01,您应该得到更小的树,这更容易理解。
    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3357年RM数据科学家
    解决方案接受
    你好,
    我不知道结果树是什么。但是你的解释听起来很合理。确保每个关卡都是一个额外的AND。
    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德

答案

  • wclasterwclaster 委员、大学教授职位:43大学教授
    谢谢你!这绝对有帮助。
    在这种情况下,你会说部分答案是这样的吗

    (父母、子女、兄弟姐妹、配偶数量少)和高票价意味着生存?
    实际上还有另一个yes leaf,它有更多的数据,我想可以这样描述
    乘客票价高且(父母、子女)<3.5且(兄弟姐妹、配偶)<2.5,意味着生存。

    再次感谢!

登录注册置评。