将一个示例集的每一行与另一个示例集的所有行进行比较

Pradyumna_26Pradyumna_26 成员职位:7贡献我
我有两个示例集,例如A和B,它们具有相同的属性名称集,并且需要将A中的每一行与B中的所有行进行比较,以便根据特定属性的标准进行分类。我最初的想法是使用循环示例操作符来迭代a的行,并检索B并在循环中应用过滤器示例操作符(在每次迭代中)。问题是我找不到一种方法来使用宏来设置过滤器参数(在特定的行迭代中来自a的属性值)。这已经是一个障碍,我的任务相当多天了,任何帮助/见解/建议将非常感谢!

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:867独角兽
    @Pradyumna_26

    如果示例集不是太大,则可以使用笛卡尔积(一种连接,但所有内容与所有内容连接),然后使用Generate Attributes进行必要的比较,然后使用Filter Examples只保留所需的内容。

    如果它们太大,您可以分批处理A,例如100或1000行,与整个B连接。

    如果您想使用循环示例,请在循环中使用Extract Macro,并设置data_value和%{example}作为示例索引。

    问候,

    Balazs
登录注册置评。