如何预测快速矿工的响应率或响应

User111113User111113 成员职位:24Maven
2019年11月编辑 帮助
你好,

我对快速矿工相当陌生,正在寻找一种基于过去2年历史数据预测响应率的方法。
我有客户id和类别,当然还有邮寄的数量和回复

例如

id category state年月qtymails Responses收到的响应率
1 a OH 2018年10月5000 200 4%
1 b CA 2018年11月10000 130
1 c PA 2018年12月35000 512
2
2

等等......我想预测下个月的反应或反应率

最好的答案

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    您可以尝试一些简单的ML算法,如决策树或朴素贝叶斯,看看它们是什么样子。但如果你只有每月的数据,你实际上没有那么多的数据来训练模型,所以如果拟合不是那么好,也不要感到惊讶。如果您查看交叉验证操作符教程,它将提供一些关于如何设置此过程的指导。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入数据科学咨询由认证的RapidMiner专家
    sgenzer User111113
  • User111113User111113 成员职位:24Maven
    @Telcontar120
    谢谢你的回复。

    我尝试了一些东西,并看了一些例子。它给了我很多错误,并要求我自动修复,我甚至不知道如何以及为什么它这样做。它只运行了一次,并将年作为预测值,它应该是响应或响应率。我被困住了,不知道该如何前进
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @User111113

    为了让我们了解到底发生了什么,你能分享一下吗:

    -你的过程(通过文件-->出口流程
    -你的资料

    问候,

    莱昂内尔
    Tghadially
  • User111113User111113 成员职位:24Maven
    这是我的数据文件
  • User111113User111113 成员职位:24Maven

    Tghadially
  • User111113User111113 成员职位:24Maven
    lionelderkrikor这里我附加了进程
    Tghadially
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @User111113

    这个错误意味着你的训练集和测试集的属性并不完全相同。
    此错误是由从标称到数值操作员在培训的部分交叉验证在训练集中而不是在测试集中创建属性的操作符。
    解决办法是移动从标称到数值CV算子之外的运算符。

    在附件中,工作过程。

    问候,

    莱昂内尔
    User111113 Tghadially
  • User111113User111113 成员职位:24Maven
    2019年12月编辑
    @lionelderkrikor

    谢谢你的回复。我用了决策树,看起来效果不错。我想知道这里还有一件事,这些模型给出的响应是基于什么参数的,比如在我的情况下,我想让模型基于类别和状态或可能是类别,状态和总邮寄量做出预测。

    我能不能自己设置,让它只看这2或3列来预测响应。
  • User111113User111113 成员职位:24Maven
    @lionelderkrikor

    我想我还有几个问题....


    当我尝试自动建模时,它显示“返回”和“下一个按钮”有时,有时它没有。如果你看到下面的截图,我不能后退或前进…有时确实会出现。你知道怎么解决吗。


    Tghadially
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @User111113

    奇怪!

    尝试选择您想要预测的属性(标签)。

    问候,


    莱昂内尔
    Tghadially
  • User111113User111113 成员职位:24Maven
    @lionelderkrikor
    @Telcontar120

    谢谢你的帮助。

    我想在我的数据中添加更多的参数来预测反应,但我想看到更好的方法。我有像0,1,2,3这样的索引假设响应的索引0更高现在我的数据会像下面这样。


    id类别索引状态年月qtymails Responses Received
    1 a 0 OH 2018年10月3000 150
    1 a 1 OH 2018年10月1000日40 1 a 2 OH 2018年10月1000日10
    1 b CA 2018年11月10000 130
    1 c PA 2018年12月35000 512
    2
    2


    我的问题是,我知道改变反应的重要因素是指数,州和月份,但它们的影响有多大,比如可能是%,我们能发现吗,也有可能按县或邮政编码提供数据,然后看看是否有任何区别,因为人们可能只来自3个邮政编码,而不是来自其他2个....

    我的脑子里有很多东西,希望我没有把大家搞糊涂

    当我尝试做自动建模时,它说“取消选择”quantityemail列,如果我这样做,我知道它不会起作用,因为我看到响应预测,他们根本达不到标准,技术上一切都是一样的……所以我从不取消选择这一列
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @User111113

    我很难理解你的问题是什么…
    你能更明确地解释你得到了什么和你想要得到什么吗?
    与此同时,您确实可以将您的数据集应用到autommodel。如果您对一个或多个列(属性)有疑问
    首先选择它(它们)并启用自动特征选择在运行之前AutoModel.总之,这些属性是不相关的
    它们将从最终的功能集中删除。
    关于“权重”,您可以看到,对于几个模型,您可以通过单击来访问每个常规属性的权重
    权重对于一个给定的模型。

    希望这能有所帮助,

    问候,

    莱昂内尔

    Tghadially User111113
  • User111113User111113 成员职位:24Maven
    @lionelderkrikor

    我做了更多的研究,修改了我的数据集,并生成了新的模型。我的问题是:

    我怎样才能降低错误率,有更好的表现?

    我需要验证我的模型吗?如果是,那么在我们使用自动模型部署模型之后,我们怎么做呢?

    你对模型分组有什么看法?
登录注册置评。