这里的所有功能请求都由我们的产品团队监控。

投票问题!

拥有高票数(通常≥10票)的想法在我们的路线图中被优先考虑。

注意:如果你想建议一个新的功能,请发布一个新的问题和标签为“功能请求”。谢谢你!

从一个RapidMiner进程生成多个可视化

christos_karraschristos_karras 成员职位:50大师
2019年12月编辑 产品创意
我想在以下情况下自动生成RapidMiner可视化:
-为数据集中最相关的变量对生成一组散点图,并将所有结果可视化存储在RapidMiner存储库中,以便可以轻松查看
-在新数据上重新生成先前生成的可视化,外观与上次生成时完全相同(无需手动导出和重新导入可视化的JSON定义)

我发现做到这一点的唯一方法是通过Python脚本操作符(使用matplotlib并将结果保存到RapidMiner存储库中的PNG文件)。是否有一种方法可以使用RapidMiner的可视化(使用内置操作符或使用扩展)做同样的事情?
DocMusher Biersepp ceaperez
3.
3票

开放投票·最后一次更新

ic - 1721

评论

  • pschlunderpschlunder 员工、RapidMiner认证分析师、RapidMiner认证专家、RMResearcher、会员职位:96RM研究

    谢谢你的建议。事实上,这是一个非常有用的场景。到目前为止,您可以通过python使用所描述的方式,或者使用报告扩展来自动生成可视化。

    对于未来,像你描述的机制可能是一个很好的方法。你希望它是怎样建成的?一种选择可能与你所描述的很接近:
    有一个新的“应用图配置”操作符,允许将新的图配置对象应用到数据集。输出将是一个图。

    让我知道你的想法是什么。

    ——菲利普
    BalazsBarany
  • christos_karraschristos_karras 成员职位:50大师
    @pschlunder

    关于报告扩展,我不知道它,我今天用它做了一点实验,以后会用它做更多的实验,但它似乎不像我想象的那样容易使用。它还生成静态图像,而不是交互式可视化。如果目的是与他人共享可视化结果,这可能是有用的,但如果目的是作为进一步数据探索的起点,则不是有用的。

    此外,对于报告扩展,如果我使用在JSON文件中定义的可视化,则JSON实际上不会存储在RapidMiner进程中,因此如果我删除JSON文件,它就会中断。因此,当共享RapidMiner进程通过将它们存储在RapidMiner服务器存储库中来生成报告时,这将是一个问题。

    你所描述的“应用情节配置”更接近我的想法,但我想详细说明一下:
    -操作符应该包括一个“设计器”视图,在结果选项卡中打开与可视化设计器相同的UI。
    -绘图配置应直接存储在过程文件中(作为操作员配置的一部分),而不是存储在外部JSON文件中。但是通过导出/导入JSON文件来重用现有配置也应该是可能的
    -应该可以在设计器中引用宏,例如定义变量名称的宏,以便在X轴,Y轴,颜色,大小等上绘图
    -如果在循环操作符中使用,应该可以有一个单一的“IOObjectCollection”(或类似的东西),将所有的图组合在一个对象中,这样它就可以作为一个对象存储在存储库中。还应该可以指定集合中每个对象的名称,例如“Var1-Var2-ScatterPlot”。
    -每个存储的可视化应该是完全互动的。例如,它应该可以放大一个生成的散点图,为特定的散点图定制颜色,等等

    谢谢
  • pschlunderpschlunder 员工、RapidMiner认证分析师、RapidMiner认证专家、RMResearcher、会员职位:96RM研究

    感谢您的详细输入。当我们在做的时候,我会和同事分享的!

    关于共享进程时JSON文件的问题,您可以使用Read JSON操作符加载JSON文件,然后将加载的ExampleSet存储在Repository中,以便以后重用它。这可能会有所帮助。

    欢呼,
    菲利普
登录注册置评。