“市场篮子分析中心问题”

SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
2019年6月编辑 帮助
你好,

我有一个问题与我的工作流程:

我有一个数据集

CardID |产品
10150年软饮料
10236年啤酒


每次我想旋转时,Product-Column就消失了。
Pivoting有如下配置:

组属性:cardid
索引属性:Product

我不明白为什么产品消失....

问候

SunnyLotusFlower






答案

  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    没人知道这个问题吗?是臭虫还是sm之类的?

    问候

    莲花
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    不,不是一个错误,但您需要一个额外的列,其中包含应该放在结果表中的值。试一试:

    CardID |产品|数量
    10150软饮
    10236啤酒1


    你会没事的。

    欢呼,
    Ingo
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    他没有工作。我对透视操作符有如下设置:

    组属性卡
    索引属性:product

    我创建了一个新的列数

    问候

    莲花
    ____________________
    更新
    我注意到,旋转操作符已经删除了我的产品列,并没有显示结果列





  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    在myexperiment.org上有一个如何使用Pivoting操作符的工作示例。只需安装社区扩展并下载名为“Pivoting”的过程。在这里,您将看到这个过程是如何工作的。

    欢呼,
    Ingo
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    我掌握了工作流程。我可以复制这个问题,如果我移除添加噪声操作符。

    但是为什么这里有“加噪声”算子呢?这很令人困惑……


    问候

    莲花
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    你好,

    您将需要一个额外的列,其中包含应该放入结果表中的值。

    为什么这里有“加噪声”算子?这很令人困惑……
    做一个有根据的猜测……这个噪声属性可以用来做什么?

    正确:应该放在结果表中的值!

    欢呼,
    Ingo
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    嗯,至少我发现了一些有趣的东西。


    如果我构造一个列计数,与实例all = 1(所有的例子都有相同的!!进入),则枢轴操作符不执行旋转。

    为什么我做不到?我是不是忘了一个重要的细节?




    问候莲花
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    还是这是个bug ?

    问候

    莲花
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    你好,

    谢谢你指出这个问题。这可能确实是一个bug。我已经提交了一个bug报告

    http://bugs.rapid-i.com/show_bug.cgi?id=380

    欢呼,
    Ingo
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    奇怪的是,这个特性导致了我一直描述的问题。

    我想我还有一个bug要给你:

    我可以发给你一个数据集吗?

    因为不是所有的列显示时,枢轴…

  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    你好,

    我可以发给你一个数据集吗?
    没有,但你可以把它连接到漏洞上或者我们的某个开发人员身上。

    欢呼,
    Ingo
  • CrazyTCrazyT 成员职位:8因素二世
  • SunnyLotusFloweSunnyLotusFlowe 成员职位:37Maven
    使用我的数据集,我构建了以下工作流:

    读取Csv ->生成空->数值到多标称->

    替换缺失值-> set data -> pivot -> set data(2) ->替换缺失值

    ______________

    好,绕过我之前描述的问题,我使用操作符“设置数据”。
    我把第一个例子改为2,剩下的计数都是1。然后旋转
    有了旋转。如果我在第二个集合数据操作符中查找,必须有超过3列
    我可以选择。

    换句话说:旋转算子在第二组数据op I中得到15个正则属性和I
    只能在3中选择。肯定有15个!


    问候

    莲花


    _________________

    这是数据的一部分。它应该放在csv-data中,然后我上面写的工作流应该被构建来复制“错误”。

    cardid、产品
    10150年,软饮料
    10150年,fruitveg
    10236年,frozenmeal
    10236年,啤酒
    10360年,鱼
    10360年,cannedveg
    10360年,啤酒
    10360年,frozenmeal
    10451年,糖果
    10451年,frozenmeal
    10451年,啤酒
    10451年,cannedveg
    10609年,鱼
    10609年,fruitveg
    10614年,软饮料
    10645年,fruitveg
    10645年,frozenmeal
    10645年,啤酒
    10645年,cannedveg
    10645年,鲜肉
    10717年,鱼
    10717年,fruitveg
    10717年,鲜肉
    10872年,鱼
    10872年,frozenmeal
    10872年,cannedveg
    10872年,啤酒
    10902年,fruitveg
    10902年,酒
    10915年,fruitveg
    10915年,cannedmeat
    10915年,鱼
    10915年,奶制品
登录注册置评。