如何预测快速矿工的响应率或响应

User111113 · 2019年11月

你好,

我对快速矿工相当陌生，正在寻找一种基于过去2年历史数据预测响应率的方法。
我有客户id和类别，当然还有邮寄的数量和回复

例如

id category state年月qtymails Responses收到的响应率
1 a OH 2018年10月5000 200 4%
1 b CA 2018年11月10000 130
1 c PA 2018年12月35000 512
2
2

等等......我想预测下个月的反应或反应率

lionelderkrikor · 2019年12月

@User111113，
当然!

-放一个选择属性操作符后，您的数据检索。
—在该操作符的参数中，选择属性筛选器类型=子集
-选择2 - 3个相关属性:

Image: https://us.v-cdn.net/6030995/uploads/editor/ws/n0u47k21c5n4.png

问候,

莱昂内尔

varunm1 · 2019年12月

你好@User111113

我怎样才能降低错误率，有更好的表现?

你在优化预测模型吗?你需要从特征选择、优化超参数(“优化参数网格”)、尝试不同的模型、从现有特征生成新特征等方面采用概念。由于没有单一的解决方案来提高模型的性能。您可以在建模中尝试上述概念，以检查是否可以获得更好的性能。

我需要验证我的模型吗?如果是，那么在我们使用自动模型部署模型之后，我们怎么做呢?

是的，您需要验证您的模型。有不同的验证方法，如交叉验证，分割验证和多重保留验证(用于汽车模型)。自动模型在训练和测试您的模型时使用多次验证。部署后你可以在新的数据上得分，我不清楚这个问题。一旦我们部署了一个模型，它就会预测标签。如果你有新的原始标签，你总是可以检索你训练过的模型，然后将模型应用于新数据，并使用性能来检查新数据的性能。

Telcontar120 · 2019年11月

您可以尝试一些简单的ML算法，如决策树或朴素贝叶斯，看看它们是什么样子。但如果你只有每月的数据，你实际上没有那么多的数据来训练模型，所以如果拟合不是那么好，也不要感到惊讶。如果您查看交叉验证操作符教程，它将提供一些关于如何设置此过程的指导。

User111113 · 2019年12月

@Telcontar120
谢谢你的回复。

我尝试了一些东西，并看了一些例子。它给了我很多错误，并要求我自动修复，我甚至不知道如何以及为什么它这样做。它只运行了一次，并将年作为预测值，它应该是响应或响应率。我被困住了，不知道该如何前进

lionelderkrikor · 2019年12月

嗨@User111113，

为了让我们了解到底发生了什么，你能分享一下吗:

-你的过程(通过文件-->出口流程）
-你的资料

问候,

莱昂内尔

User111113 · 2019年12月

这是我的数据文件

User111113 · 2019年12月

Image: https://us.v-cdn.net/6030995/uploads/editor/am/ccc25rs5jc74.jpg

User111113 · 2019年12月

lionelderkrikor这里我附加了进程

lionelderkrikor · 2019年12月

嗨@User111113，

这个错误意味着你的训练集和测试集的属性并不完全相同。
此错误是由从标称到数值操作员在培训的部分交叉验证在训练集中而不是在测试集中创建属性的操作符。
解决办法是移动从标称到数值CV算子之外的运算符。

在附件中，工作过程。

问候,

莱昂内尔

User111113 · 2019年12月

@lionelderkrikor

谢谢你的回复。我用了决策树，看起来效果不错。我想知道这里还有一件事，这些模型给出的响应是基于什么参数的，比如在我的情况下，我想让模型基于类别和状态或可能是类别，状态和总邮寄量做出预测。

我能不能自己设置，让它只看这2或3列来预测响应。

User111113 · 2019年12月

@lionelderkrikor

我想我还有几个问题....

当我尝试自动建模时，它显示“返回”和“下一个按钮”有时，有时它没有。如果你看到下面的截图，我不能后退或前进…有时确实会出现。你知道怎么解决吗。

Image: https://us.v-cdn.net/6030995/uploads/editor/ji/ea3w8im52i6m.jpg

lionelderkrikor · 2019年12月

嗨@User111113，

奇怪!

尝试选择您想要预测的属性(标签)。

问候,

莱昂内尔

User111113 · 2019年12月

@lionelderkrikor
@Telcontar120

谢谢你的帮助。

我想在我的数据中添加更多的参数来预测反应，但我想看到更好的方法。我有像0,1,2,3这样的索引假设响应的索引0更高现在我的数据会像下面这样。

id类别索引状态年月qtymails Responses Received
1 a 0 OH 2018年10月3000 150
1 a 1 OH 2018年10月1000日40 1 a 2 OH 2018年10月1000日10
1 b CA 2018年11月10000 130
1 c PA 2018年12月35000 512
2
2

我的问题是，我知道改变反应的重要因素是指数，州和月份，但它们的影响有多大，比如可能是%，我们能发现吗，也有可能按县或邮政编码提供数据，然后看看是否有任何区别，因为人们可能只来自3个邮政编码，而不是来自其他2个....

我的脑子里有很多东西，希望我没有把大家搞糊涂

当我尝试做自动建模时，它说“取消选择”quantityemail列，如果我这样做，我知道它不会起作用，因为我看到响应预测，他们根本达不到标准，技术上一切都是一样的……所以我从不取消选择这一列

lionelderkrikor · 2019年12月

嗨@User111113，

我很难理解你的问题是什么…
你能更明确地解释你得到了什么和你想要得到什么吗?
与此同时，您确实可以将您的数据集应用到autommodel。如果您对一个或多个列(属性)有疑问
首先选择它(它们)并启用自动特征选择在运行之前AutoModel．总之，这些属性是不相关的
它们将从最终的功能集中删除。
关于“权重”，您可以看到，对于几个模型，您可以通过单击来访问每个常规属性的权重
在权重对于一个给定的模型。

希望这能有所帮助，

问候,

莱昂内尔

User111113 · 2019年12月

@lionelderkrikor

我做了更多的研究，修改了我的数据集，并生成了新的模型。我的问题是:

我怎样才能降低错误率，有更好的表现?

我需要验证我的模型吗?如果是，那么在我们使用自动模型部署模型之后，我们怎么做呢?

你对模型分组有什么看法?

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

如何预测快速矿工的响应率或响应

最好的答案

是安全的。遵循预防措施，保持社交距离

答案