类别

版本

应用你的模型

新的数据集

当您创建模型时,您提前知道了答案。例如,当我们创建一个模型通过广告预测销售额我们知道电视、广播和报纸的广告预算,也知道由此产生的销售数字。如果没有这些信息,就没有明显的方法来构建模型。

Advertising.csv

电视 广播 报纸 销售
1 230.1 37.8 69.2 22.1
2 44.5 39.3 45.1 10.4

一旦有了模型,模型的工作就是提供答案。要做到这一点,它需要新数据作为输入,与用于构建模型的数据兼容。

Advertising.csv,第一列是不需要的,因为它被标识为ID并被取消选中。目标栏是“销售额”;未来的价值未知。

假设我们正在计划下一次广告活动的预算,我们有三个不同的提案。通过将模型应用于下面的数据,我们可以预测每种产品的“销量”,并比较结果。

关于广告预算的三个提案

电视 广播 报纸
200 0 One hundred.
250 50 0
300 0 0

请注意,这些值是从训练集中的值范围内选择的:

  • 电视:0 - 300
  • 无线电:0 - 50
  • 报纸:0 - 114

如果您希望基于此范围之外的值进行预测,则误差可能比测试集的误差更大。

将您的模型应用于新数据集

您可以将您的模型应用于新数据集:

  1. 在你完成建造之后,从内部开始检查结果,或

  2. 稍后,通过点击最近的分析,via首页>管理最近的分析

一旦你选择了一个分析:

  1. 选择一个模型(在本例中,决策树

  2. 点击应用模型,并选择应用于新的数据集从下拉菜单中

  3. 点击添加数据,并上传新的数据集

  4. 当显示新的数据集时,单击计算预测

  5. 将显示新的数据集以及预测结果

关于我们的三个广告预算提案,有一个明显的赢家!预测模型表明,为了使预期销售额最大化,我们应该大力投资电台广告。电视和报纸广告的数量似乎不那么重要,至少在这些例子中是这样。

单击出口,如欲下载表格的Excel格式(prediction_result.xlsx).