没有标签的决策树…这可能吗?
Eleon0r_Galisky
成员职位:2新手
在帮助
我的任务分为两部分:首先,我使用11列的数据集加上一个目标二项变量(心脏病:是或否)来选择预测心脏病发作的最佳模型。
我成功地将模型与ROC进行了比较。在决策树、随机森林、k-NN、规则归纳法和朴素贝叶斯中,我发现决策树是最好的。
任务的下一部分是将最佳模型应用于另一个数据集,但这里缺少目标。现在我又有了11列,但是没有心脏病发作的列,因为模型应该预测它。
由于决策树需要一个标签,因此流程将不会运行。上述任何一种模型都会出现同样的问题。怎么解呢?
请记住,这是一个学校的例子,因此数据集非常干净。遗憾的是,我不能分享。
我有一个截止日期,所以请帮助我!!
提前感谢大家。
我成功地将模型与ROC进行了比较。在决策树、随机森林、k-NN、规则归纳法和朴素贝叶斯中,我发现决策树是最好的。
任务的下一部分是将最佳模型应用于另一个数据集,但这里缺少目标。现在我又有了11列,但是没有心脏病发作的列,因为模型应该预测它。
由于决策树需要一个标签,因此流程将不会运行。上述任何一种模型都会出现同样的问题。怎么解呢?
请记住,这是一个学校的例子,因此数据集非常干净。遗憾的是,我不能分享。
我有一个截止日期,所以请帮助我!!
提前感谢大家。
0
最佳答案
-
lionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽嗨@Eleon0r_Galisky,
这是数据科学中的经典工作流:乐鱼平台进入
首先,你用一个有标签的数据集训练一个模型(在你的例子中是一个决策树)
-然后你把这个训练好的模型应用到一个未标记的数据集上,来预测这个数据集的标签。
为此,你必须使用应用模型操作符。
请查看附件中的过程以理解我的意思。
希望这能帮到你,
问候,
莱昂内尔2
答案
非常感谢!!
我无法表达我有多高兴,因为我得到了及时而明确的回答!