从一个RapidMiner进程生成多个可视化

christos_karras · 2019年12月

我想在以下情况下自动生成RapidMiner可视化:
-为数据集中最相关的变量对生成一组散点图，并将所有结果可视化存储在RapidMiner存储库中，以便可以轻松查看
-在新数据上重新生成先前生成的可视化，外观与上次生成时完全相同(无需手动导出和重新导入可视化的JSON定义)

我发现做到这一点的唯一方法是通过Python脚本操作符(使用matplotlib并将结果保存到RapidMiner存储库中的PNG文件)。是否有一种方法可以使用RapidMiner的可视化(使用内置操作符或使用扩展)做同样的事情?

pschlunder · 2019年12月

嘿@christos_karras，

谢谢你的建议。事实上，这是一个非常有用的场景。到目前为止，您可以通过python使用所描述的方式，或者使用报告扩展来自动生成可视化。

对于未来，像你描述的机制可能是一个很好的方法。你希望它是怎样建成的?一种选择可能与你所描述的很接近:

有一个新的“应用图配置”操作符，允许将新的图配置对象应用到数据集。输出将是一个图。

让我知道你的想法是什么。

——菲利普

christos_karras · 2019年12月

嗨@pschlunder，

关于报告扩展，我不知道它，我今天用它做了一点实验，以后会用它做更多的实验，但它似乎不像我想象的那样容易使用。它还生成静态图像，而不是交互式可视化。如果目的是与他人共享可视化结果，这可能是有用的，但如果目的是作为进一步数据探索的起点，则不是有用的。

此外，对于报告扩展，如果我使用在JSON文件中定义的可视化，则JSON实际上不会存储在RapidMiner进程中，因此如果我删除JSON文件，它就会中断。因此，当共享RapidMiner进程通过将它们存储在RapidMiner服务器存储库中来生成报告时，这将是一个问题。

你所描述的“应用情节配置”更接近我的想法，但我想详细说明一下:
-操作符应该包括一个“设计器”视图，在结果选项卡中打开与可视化设计器相同的UI。
-绘图配置应直接存储在过程文件中(作为操作员配置的一部分)，而不是存储在外部JSON文件中。但是通过导出/导入JSON文件来重用现有配置也应该是可能的
-应该可以在设计器中引用宏，例如定义变量名称的宏，以便在X轴，Y轴，颜色，大小等上绘图
-如果在循环操作符中使用，应该可以有一个单一的“IOObjectCollection”(或类似的东西)，将所有的图组合在一个对象中，这样它就可以作为一个对象存储在存储库中。还应该可以指定集合中每个对象的名称，例如“Var1-Var2-ScatterPlot”。
-每个存储的可视化应该是完全互动的。例如，它应该可以放大一个生成的散点图，为特定的散点图定制颜色，等等

谢谢

pschlunder · 2020年1月

嗨@christos_karras，

感谢您的详细输入。当我们在做的时候，我会和同事分享的!

关于共享进程时JSON文件的问题，您可以使用Read JSON操作符加载JSON文件，然后将加载的ExampleSet存储在Repository中，以便以后重用它。这可能会有所帮助。

欢呼,

菲利普

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

从一个RapidMiner进程生成多个可视化

开放投票·最后一次更新2019年12月

评论