数据集中的预测/概述
最佳答案
-
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:909独角兽嗨@Newbie_01,
首先,你必须决定你的问题是分类还是回归。
分类是一个是/否的决定。
回归是数值预测。预测丢失的日期看起来像这样,但您可能希望将日期重新编码为数字,例如2019-01-01或其他开始日期之后的天数。为此使用Generate Attributes和Date函数。
有一些建模算法可以处理丢失的数据,但最好是在如何处理和填充丢失的数据方面做出明智的决定。例如,您可能知道C2总是比C1晚至少一周,以此类推。然后用适当的值填充缺失的数据。您也可以尝试使用Impute Missing Values操作符来自动执行此操作。
一些学习算法在输出中包含属性的重要性。还有一种运算符叫做Weight by…,that rank the importance of the attributes according to their algorithm. But you will often get different or even contradictory answers from different algorithms. If you have access to AutoModel, there is also a variable importance ranking there.
我希望这能帮助你开始你的分析。
问候,
Balazs7