您正在查看9.9 -版的RapidMiner Studio文档点击这里查看最新版本
RapidMiner Studio 9.2.0有什么新功能?
发布:2019年2月5日
以下描述了RapidMiner Studio 9.2.0中的错误修复:
新功能
用新的、强大的HTML5可视化取代旧的图表和高级图表。有很多新的情节类型和能力去探索!主要特点:
- 新的图表类型:阶梯线,样条,区域,阶梯区域,样条区域,范围(直线,阶梯,柱,误差条),流图,钟形曲线,漏斗,金字塔,热图,树状图,Sankey,包装气泡,矢量,Wordcloud
- 增强了现有海图类型和新海图类型,具有多属性选择、分组、堆叠选项、反转和显示为雷达图(用于选择海图)等功能。
- 支持多个y轴
- 增加了情节线支持(在x/y/z轴上标注标记线)
- 图表配置现在会自动保存。您为您的数据集配置图表,关闭Studio,第二天回来,当您再次查看数据时,您配置的图表将再次出现!
- 有些情节可以与其他情节结合起来。您可以根据需要在单个图表中添加尽可能多的这些组合图!
- 允许您快速选择基本设置开始,也可以微调甚至小的图表细节
- 在一个图表中有多个系列(例如按标签分组的东西)?尝试悬停并单击图例项目来突出显示和隐藏各自的系列!
汽车模型
- 增加了对文本数据的支持
- 增加了聚类的特征选择
- 增加了快速大边际和多类逻辑回归学习器
- 从日期中改进特征提取(计算所有成对差异和到今天的差异)
- 添加回归预测与标签图表
- 增加相关性作为回归的性能标准
- 解释预测现在在Auto Model中是可选的,并且只在较小的数据集上自动激活
- 显著改进了Auto Model在大型数据集上的运行时间
新的文本分析操作符,用于文本的特征提取,添加情感和语言检测:文本向量化
为数据行分配批号的新操作符:生成批处理
云连接
- 新增到Azure数据湖存储(第一代)的连接:
- 读取Azure数据湖存储
- 循环Azure数据湖存储
- 写入Azure数据湖存储
- 新增到Azure数据湖存储(第一代)的连接:
时间序列
新的操作符:提取系数(多项式拟合)
- 它将多项式函数拟合到时间序列中,并提供系数和(如果选择的话)差异作为特征
- 它还提供了对附加输出端口上的时间序列的索引值进行评估的拟合函数
新的操作符:指数平滑法
- 它使时间序列平滑了一个因子
新的操作符:滞后
- 它将时间序列属性相互滞后(移动)
介绍新产品创建ExampleSet操作员从功能,数字,日期等创建示例集快速原型
增强
- 提高并行进程的CPU利用率(例如,当使用嵌套循环时)。
运行前检查和更好的错误描述滤波器的例子错误和正确的预测
属性选择对话框和组合框现在显示属性的类型(数字、标称、日期时间)
属性选择对话框现在以人类可读的方式对左侧的可用属性进行正确排序
所有“Legacy Result Access”操作符现在都已弃用,仍在使用这些操作符的现有进程将继续工作。请使用接线员商店和检索在以后的过程中。
- 使用检索而不是读模型,读聚类,读权重,读结构,读性能,读参数,读阈值和读。
- 使用商店而不是写模型,写聚类,写权重,写结构,写性能,写参数,写阈值和写。
改进了几个源操作符的元数据生成和传播
现在,不管实际的组合框宽度是多少,组合框弹出框的宽度都是内容所需要的。这有时看起来有点滑稽,但能够真正阅读内容比追求更好的外观更有用。
在Auto Model中提供了更好的信息,用于预期更长的运行时间的情况和设置
扩展打开的对话框不再显示旁边的警告图标
更改了教程的样式RapidMiner学院
改进的默认参数渐变增强树
修正
- 交叉验证现在对性能方差和标准差应用贝塞尔修正。
- 在无限循环中连接操作符不再冻结RapidMiner Studio。
- 修复了无用的错误信息:"训练H2O模型时的错误:{0}"
- 修复了一个罕见的错误日志一个进程在完成后似乎没有停止的操作符。
- 固定滑块有时看起来有点破碎的原因。
- 修复了Auto Model中功能集导航器的罕见错误,该错误可能导致图和表不对齐
- 修复了自动特征提取中的罕见错误,该错误可能导致最终特征集的错误选择
- 修复了只读存储库中的数据集在结果视图中显示并在Auto Model中打开的错误
- 时间序列
- 固定计算的第一个四分位数,中位数和第三个四分位数的提取总量
- 修正了当选择过滤器类型时所有属性选择的错误,该过滤器类型会单独检查所有示例。
- 修正了应用预测操作符的错误,如果它在并行操作符内执行。
- 修复了窗口和进程窗口在参数配置错误时的错误
- 固定交叉验证如果在交叉验证中连接了多个性能向量,则返回具有重复行的测试示例集。这不会影响任何性能指标。
发展
- 新增实用工具类PersistentContentMapperStore.该类可用于在本地用户缓存中存储任意信息。这可以用于存储存储库对象的结果配置,甚至是通过散列标识的内容。HTML5图表就是这样保存配置的例子。
- 新增实用工具类ColorChooserUtilities用于打开HSL颜色选择器
- 添加DistinctColorSlider和LinearGradientColorSliderUI组件,用户可以方便地选择和更改不同颜色/线性颜色渐变列表
- 添加ExtendedJListTransferHandler类,它允许通过拖放在JList中重新排序
- 新增接口CleanupRequiringComponentGUI结果组件可以使用它来指示它们需要在用户关闭结果后清理某些内容。每当关闭结果选项卡时,就调用它。
- 增加了对结果可视化卡片的“BETA”标签支持(在results视图中查看结果时,左边的卡片显示)。添加一个
gui.cards.I18N_KEY。Beta = true
标记到i18n属性,以指示结果渲染器为Beta版本。 - 包com.rapidminer.gui.plotter和com.rapidminer.gui.new_plotter已弃用,并将在将来被删除。