“超过5000行的图表”

Lior17Lior17 成员职位:2新手
2019年5月编辑 帮助
你好,

我有一个大约有25k行的数据集。
我试着为它创建一个图表,但我在工作室里得到了一个信息:
"数据集采样至5000行以加速图表创建"

现在来看事实:
在我的执照(教育执照)中,我有:
无限数据行
无限逻辑处理器
我在工作室首选项中找到了以下配置:
用户界面->图表的最大行数
我把它从5000改为50000,它没有帮助,我试着重新启动,仍然什么也没有。

这是一个bug吗?还是我没注意到什么?

谢谢,

Lior。

答案

  • David_ADavid_A 管理员,主持人,员工,RMResearcher,成员职位:286RM研究
    2019年1月编辑
    你好,

    不,在这种情况下,它绝对不是一个bug,而是一个功能眨眼:

    设置—>用户界面—>图表你可以找到一个选项“图表中的最大行数”,默认设置为5k。
    但是请注意,根据您的数据和机器,25k行可能需要一段时间来呈现图表。

    好消息是,在即将到来的版本中,将会有一个更新的图表引擎,它可以更好地处理大型图表。

    最好的
    大卫
    sgenzer
  • Lior17Lior17 成员职位:2新手
    你好大卫,

    谢谢你的回复,但正如我在我的问题中所述,设置这个值50k并没有帮助,即使在重新加载数据到turboprep并重新启动整个工作室之后。

    最好的

    Lior。
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区管理员、rmresearch研究员、成员、大学教授职位:1751年RM创始人
    嗨Lior,
    谢谢你指出这一点。Turbo Prep确实为图表使用了5000个数据点的硬限制,如果有更多,则随机抽样。不幸的是,它没有使用其他人提到的设置。这样做是为了在数据准备阶段进行一些基本的探索时确保平稳的用户体验。从长远来看,Turbo Prep中的图表将被David上面提到的新的可视化框架所取代。但就目前而言,我们决定在一个数据示例中提供旧图表,以便TP用户至少有一些图表选择。
    不过,有一个变通方法允许您查看所有数据(在这里讨论的设置中定义的限制范围内)。这有点麻烦,但可能对你的情况有帮助。您可以从TP中“导出”数据,并将其保存在您的存储库中。简单地双击存储库面板中保存的数据,将在结果视图中显示数据,在那里您将获得完整的图表体验。
    很抱歉给您带来不便。最好的
    Ingo
    David_A sgenzer SGolbert
  • jithinpaul89jithinpaul89 成员职位:3.贡献我
    你好Lior,
    您可以将Visualizations行限制修饰符编辑为适当的值(如5.0)以使其工作。
  • jacobcybulskijacobcybulski 委员,大学教授职位:391独角兽
    最简单的解决方案是在绘图之前将数据样本减少到5,000。事实上,当使用没有数据量限制的遗留图表时,RapidMiner经常会冻结很长一段时间,或者Java会崩溃。
登录注册置评。