类别

版本

您正在查看9.9 -版本的RapidMiner Go文档点击这里查看最新版本

检查模型

下面的页面记录了web应用程序RapidMiner Go。要安装RapidMiner Go,您需要一个本地许可。请联系销售了解更多信息。

结果

在RapidMiner Go的前4个步骤中,您可能已经点击了自己的方式。现在你需要放慢脚步,坚持你的专业知识。乍一看,结果似乎是压倒性的,所以不要忽视目的:

  1. 为了帮助您识别最有用的模型(参见性能指标模型比较

  2. 为了帮助您更好地理解模型和数据(参见权重模型模拟

  3. 作出预测,在完成步骤(1)和(2)后

如果您正在寻找一个用户友好的起点,请查看模型模拟

虽然将您的模型视为黑盒、插入新数据并进行预测可能很诱人,但黑盒预测的输出可能具有误导性——请参阅流失示例的总结

目录表

性能指标

要说一个模型是好是坏,特别是它比其他模型好还是差,我们需要有一些比较的基础。通过给模型分配一个成功的数字衡量标准,一个所谓的性能指标,你可以将它与其他模式进行比较,了解它的相对成功程度。

复杂的是,存在许多不同的性能指标,没有一个是绝对的成功标准;每个都有优点和缺点,这取决于你想要解决的问题。您必须为您的问题选择最佳的性能指标,并且借助此性能指标,您可以选择最佳模型。

为了计算性能指标,我们首先基于80%的随机数据样本构建一个模型训练集)。一旦建立,我们将该模型应用于剩余的20%的数据(称为测试集),并将预测值与已知值进行比较。理想情况下应该没有区别,但在实践中通常是有区别的,因为预测很少是100%正确的。

回想一下2.选择列要解决的问题类型取决于目标列中的值。它们是分类的还是数字的?根据你试图预测的内容,有不同的性能指标。有关更详细的讨论,包括示例,请参阅以下链接:

模型比较

一旦你选择了性能指标,您可以使用模型比较来帮助您根据该度量找到最佳模型。

模型对比显示各模型的性能:

  • 作为柱状图,对于任何特定的性能指标,将模型进行正面比较
  • 作为一个表,以模型为行,以性能指标为列

单击一个性能指标以显示该指标的条形图。点击一个模型来了解更多关于模型的细节。正如在5。二元分类回忆是流失预测数据最有用的指标,根据该指标,性能最好的模型是什么决策树随机森林

权重

点击权重图标,以了解更多关于您的数据,独立于模型。的权重告诉您哪些输入数据最有可能影响预测。从3.选择输入,我们已经知道“客户服务呼叫”是流失预测数据中最重要的一栏。的权重显示“国际计划”,“日分钟数”和“日费用”是接下来最重要的列,尽管它们的权重要小得多。

模型模拟,更改具有最高权重的输入数据的值,您将很快理解该数据的重要性。权重较低的输入数据不太可能产生影响。

模型模拟

RapidMiner Go不仅可以帮助您获得结果;它还可以帮助您理解这些结果。要获得更好的洞察力,请单击模型模拟图标,并选择一个模型。我们选择决策树,自从…模型比较我认为这是一个很好的模型,相对来说易于解释

世界之美模型模拟它是交互式的,所以你可以随意改变所有的值,并立即看到对预测的影响。通过操作所有的滑块和下拉列表,您可以快速构建模型的一些直觉,甚至是难以解释的模型,如深度学习。

对于初始状态,模型模拟选择平均数据值,显示在左侧。在右边,显示了一个预测(“不”,普通客户不会流失),以及一些重要因素。在重要因素的顶部是“CustServ Calls”,这是最高的数据列重量,其与目标列的高度相关性甚至在我们建立任何模型之前就被确定了3.选择输入

通过在“CustServ Calls”的初始值上来回移动滑块3.57,因此我们可以期望学到一些东西。特别注意,当“CustServ Calls”的值增加到7.00,预测从“否”变为“是”。结论?给客服打太多电话,客户就会流失!其他滑块都没有相同的效果。

当“CustServ Calls”的值介于6和7之间时,从“no”到“yes”的转换发生得相当突然,但在此之前就有麻烦的迹象,请参见重要的因素。你可以把它看作是抗议投票。随着“客户服务呼叫”增加到7.00,它越来越强烈地反对“否”的预测,最终达到一个值-0.87重要的因素,在预测变为“是”之前。然后抗议结束了,“CustServ Calls”同意这个预测。

CustServ调用 预测 重要因素(客户服务电话)
2.00 没有(98.04%) 0.0
3.00 没有(98.04%) 0.0
4.00 没有(98.04%) -0.28
5.00 没有(98.04%) -0.55
6.00 没有(98.04%) -0.79
6.50 没有(83.55%) -0.86
6.90 没有(54.56%) -0.87
7.00 是的(59.93%) + 0.87
7.20 是的(74.42%) + 0.86
8.00 是的(74.42%) + 0.75

出口

RapidMiner Go不是一个黑匣子。从每个模型的详细信息视图中,您可以出口一份RapidMiner过程那创造了它,你可以进口该过程进入RapidMiner Studio进行更详细的检查。在那里你可以运行进程,可以修改进程,可以做任何你喜欢的改变!