决策树基尼系数

nesebaznesebaz 成员职位:3.新手
你好,
我正在尝试使用决策树技术来诊断偏头痛。我刚开始使用rapidminer。我有训练和测试数据集。它们没有任何缺失的值。我不明白这是真的还是假的。因为分类不是由每个分支中的单个类组成的。我正在添加截图。怎样才能提高准确率,怎样才能有更好的决策树?
谢谢你!
标记:

答案

  • nesebaznesebaz 成员职位:3.新手

    我的准确度是%55





  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    我认为你问错了问题。你会问如何提高准确性,以及如何得到一个更好的决策树。我可能会问一系列非常不同的问题,比如下面这些。标签类是什么意思?我的训练数据集有多大?测试和训练数据集是否一致?什么模型最适合这些数据?哪些数据预处理可以改善模型训练?如何对选定的模型进行调优以产生最佳性能?等。

    首先,我观察到你的测试数据不是很大。训练数据也是这样吗?我可以看到你的标签有三个类别,这些类别中哪一个是正的-或者这些类别中哪一个是你最感兴趣的并且希望模型准确预测?如果是的话,模型性能的哪种度量最适合您的目标?(也许准确性并不是衡量模型性能的最佳标准)。标签类似乎是非排他性的,这是预测的问题吗?你的标签类是不平衡的,那么如何平衡模型训练的类,因为这通常会提高模型的性能?你的标题暗示你的决策树使用基尼指数,你尝试过不同的节点分割标准吗?你有没有尝试过其他的模型参数?你有没有更系统地研究过这些参数? Have you tried other classifiers with this data? So, start answering those questions first.
    lionelderkrikor
登录注册置评。