没有标签的决策树…这可能吗?

Eleon0r_GaliskyEleon0r_Galisky 成员职位:2新手
我的任务分为两部分:首先,我使用11列的数据集加上一个目标二项变量(心脏病:是或否)来选择预测心脏病发作的最佳模型。

我成功地将模型与ROC进行了比较。在决策树、随机森林、k-NN、规则归纳法和朴素贝叶斯中,我发现决策树是最好的。

任务的下一部分是将最佳模型应用于另一个数据集,但这里缺少目标。现在我又有了11列,但是没有心脏病发作的列,因为模型应该预测它。

由于决策树需要一个标签,因此流程将不会运行。上述任何一种模型都会出现同样的问题。怎么解呢?

请记住,这是一个学校的例子,因此数据集非常干净。遗憾的是,我不能分享。

我有一个截止日期,所以请帮助我!!

提前感谢大家。

最佳答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    解决方案接受
    @Eleon0r_Galisky

    这是数据科学中的经典工作流:乐鱼平台进入
    首先,你用一个有标签的数据集训练一个模型(在你的例子中是一个决策树)
    -然后你把这个训练好的模型应用到一个未标记的数据集上,来预测这个数据集的标签。

    为此,你必须使用应用模型操作符。

    请查看附件中的过程以理解我的意思。

    希望这能帮到你,

    问候,

    莱昂内尔
    BalazsBarany Eleon0r_Galisky

答案

  • Eleon0r_GaliskyEleon0r_Galisky 成员职位:2新手
    是的,那起作用了!

    非常感谢!!

    我无法表达我有多高兴,因为我得到了及时而明确的回答!

    lionelderkrikor
登录注册置评。