枢轴操作符-在选择属性之后“检测到潜在问题:属性缺失”

Ina_KIna_K 成员职位:9因素二世
2018年11月编辑 帮助

你好,

根据我的数据准备过程中的枢轴操作符,RapidMiner遇到了一个“潜在问题”:

18 - 01 - 2017 _pivot_prob.png

我必须处理大量的数据。

在Select Attributes中,我选择了三个属性。其中一个名为TBLUNIQUELRU_ID被pivot操作符遗漏了,尽管它包含在Select Attributes输出数据中:

数据:SimpleExampleSet: 10000000个示例,3个常规属性,无特殊属性

在第二个操作符之后设置了一个断点,我可以确认该属性包含在pivot中输入设置示例。

代码:

<过程扩展= " true " >




< /操作符>



< /操作符>





< /操作符>






> < /过程

有人能帮忙吗?

最佳答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    解决方案接受

    嗨在,

    可能这只是元数据传播的问题。没有一个按钮可以让它运行吗?


    否则,我建议通过使用Process->Synchronize data with real data将元数据传播切换到真实数据。

    最好的

    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德

答案

  • Ina_KIna_K 成员职位:9因素二世

    你好,

    我遇到了一个使用其中一个操作符进行属性识别的问题。示例集需要流式处理,因为数据量非常大(> 3000万)。公司许可证和RM服务器的示例)。

    为了在本地测试和处理该过程,我使用Read Database操作符使用了一个10000行的小子集。

    每当我使用读数据库有10000个样本的子集一切正常

    每当我成立公司时流数据库我遇到一个“检测到潜在问题”Pivot操作符不识别一个关键字段(标识示例的id字段)。

    25 - 01 - 2017 _read_db_ok.png25 - 01 - 2017 _read_db_nok.png

    Stream DB的代码:


    <过程扩展= " true " >

    <过程扩展= " true " >




    < /操作符>


    < /操作符>



    < /操作符>

    <列出关键= " filters_list " >

    < / >列表
    < /操作符>





    < /操作符>






    <列出关键= "列" / >

    < /操作符>








    > < /过程
    < /操作符>

    根据你最近的建议,我把元数据和真实数据同步了。不幸的是,它没有帮助。

    我尽量避免让它运行,因为我需要知道这是否是处理需要这么长时间的原因。该过程加载长达16个小时,没有结束,卡在Pivot操作器中。我真的很想知道为什么这个潜在的问题通知出现,以及如何解决它。因为现在看起来不仅TBLUNIQUELRU_ID在输入示例中丢失了,而且属性BITID也丢失了。

    25 - 01 - 2017 _attributes_missing.png

    或者你能给我解释一下元数据传播的问题是什么吗?

    非常感谢您的建议。

    亲切的问候!

登录注册置评。