首先,我观察到你的测试数据不是很大。训练数据也是这样吗?我可以看到你的标签有三个类别,这些类别中哪一个是正的-或者这些类别中哪一个是你最感兴趣的并且希望模型准确预测?如果是的话,模型性能的哪种度量最适合您的目标?(也许准确性并不是衡量模型性能的最佳标准)。标签类似乎是非排他性的,这是预测的问题吗?你的标签类是不平衡的,那么如何平衡模型训练的类,因为这通常会提高模型的性能?你的标题暗示你的决策树使用基尼指数,你尝试过不同的节点分割标准吗?你有没有尝试过其他的模型参数?你有没有更系统地研究过这些参数? Have you tried other classifiers with this data? So, start answering those questions first.
答案
我的准确度是%55
首先,我观察到你的测试数据不是很大。训练数据也是这样吗?我可以看到你的标签有三个类别,这些类别中哪一个是正的-或者这些类别中哪一个是你最感兴趣的并且希望模型准确预测?如果是的话,模型性能的哪种度量最适合您的目标?(也许准确性并不是衡量模型性能的最佳标准)。标签类似乎是非排他性的,这是预测的问题吗?你的标签类是不平衡的,那么如何平衡模型训练的类,因为这通常会提高模型的性能?你的标题暗示你的决策树使用基尼指数,你尝试过不同的节点分割标准吗?你有没有尝试过其他的模型参数?你有没有更系统地研究过这些参数? Have you tried other classifiers with this data? So, start answering those questions first.