类别

版本

您正在查看9.7 -版的RapidMiner Studio文档点击这里查看最新版本

RapidMiner Studio 9.7有什么新功能

项目

RapidMiner Studio和Server以及JupyterHub现在支持项目的概念,使您能够构建和隔离您的工作。,允许多个用户协作,同时在整个项目中保持一致的状态。

最重要的是,项目是版本化的,提供以下很酷的功能:

  • 线性备份,您总是可以恢复到过去的状态(无论您做什么,都不会丢失任何东西)。
  • 每个快照(项目版本)都是完全一致的,因此很容易回答诸如“哪个过程训练了这个模型”之类的遵从性问题。
  • 可追溯性:快照记录谁做了什么,何时以及为什么(通过用户编写的评论)。
  • 有一个Git服务器用作版本控制后端。这也允许存储任意类型的文件,如.py或.csv,使您的项目完整。
  • 所有使用git工作的人都可以直接访问git,例如Python程序员。这允许Studio用户和Python程序员之间的项目无缝、双向集成。

使用RapidMiner Studio 9.7或更高版本创建的本地存储库也可以利用支持计算机上所有文件(.py, .jpeg, .pdf等)的优势。

HDF5作为新的文件格式

RapidMiner ExampleSets现在以一种新的文件格式写入磁盘:HDF5。这种完善的格式确保了存储大量数据时的稳定性和性能。这也意味着Python和RapidMiner Studio可以比以前更容易、更快地交换数据。

改进我们的时间序列支持

  • 新的操作符集成用不同的方法对时间序列进行积分(累积和/左右黎曼和/梯形规则)
  • 添加了为一组属性(由属性子集选择器选择)指定负延迟和默认延迟的选项滞后操作符
  • 不幸的是,由于参数键不兼容,必须弃用旧版本的'Lag'操作符,并添加具有相同名称但不同操作符键的新版本。
  • 增加了使用填充的选项快速傅里叶变换并计算频率的幅值。

我们的引导机器学习功能的改进

自动模型:*现在使用一些过程(例如SVM, FLM或权重计算)目标编码*你可以提交多个Auto Model作业到RapidMiner Server,并使用它的存储库来加载结果。

模型操作:* RapidMiner Server和RapidMiner Studio上的存储库可以用作已部署模型的存储位置(也称为“部署位置”)*未使用和ID列现在在评分后保留在结果中

更新H2O库

H2O库,我们用来提供一些流行的学习器,已经更新到最新的稳定版本(准确地说是3.30.0.1)。此更新将提高梯度增强树,逻辑回归,深度学习和广义线性模型算子的稳定性和性能。

此外,还实现了一些增强功能:-梯度增强树现在支持单调性约束-深度学习现在在单独的输出端口上暴露模型权重-模型训练可以使用专家参数进行微调。支持H2O提供的所有参数。

关于向后兼容性的说明:为了确保顺利过渡到新的H2O库版本,使用以前的RapidMiner Studio版本训练的模型将使用旧的实现应用。所有新的基于H2O的模型都将使用新的库版本进行训练和应用。

这意味着用这个版本重新训练的旧模型可能会产生与上一个版本略有不同的结果(例如模型性能)。

增强功能和bug修复

以下页面描述了RapidMiner Studio 9.7版本中的增强功能和错误修复: