类别

版本

RapidMiner Studio 9.6.0有什么新功能?

发布:2020年2月26日

以下描述了RapidMiner Studio 9.6.0中的错误修复:

新功能

  • 增加了将活动进程复制/粘贴到进程工具栏的按钮。
  • 均衡时间序列
    • 增加了两个新的操作符(数值指数相等而且均衡时间戳),提供了平衡输入时间序列的功能。输出时间序列将有新的等距指标值。操作符提供了不同的可能性来配置示例的数量、开始值和停止值以及新索引值的步长。通过使用“替换缺失值(序列)”操作计算输出时间序列的相应值。
    • 数值指数相等:将数值指标等距化为具有数值步长的数值指标。
    • 均衡时间戳:将日期-时间索引等价为等距离的日期-时间索引。以精确的持续时间(毫秒精度)作为步长,或以周期(天、周、月或年的倍数)作为步长。
  • 峰值转换:
    • 增加了两个新的操作符(Z-Score峰值变换而且最高峰变换)对时间序列进行峰值检测和转换。它们在时间序列中检测峰值,并添加一个指标峰值序列(值-1,0,1作为峰值标志值)和一个峰值序列(如果检测到峰值则为原始值,对于非峰值区域则缺失)。
    • Z-Score峰值变换:通过计算局部均值和标准差进行峰值检测,当值与该局部均值有较大偏差时,将值识别为峰值
    • 最高峰变换:对不同区域的时间序列进行分割,检查局部的极小值和极大值是有效的峰值还是只有噪声效应。
  • 峰值特征提取:
    • 新的操作符提取的山峰它执行峰值检测(通过利用一个新的峰值转换算子并提取描述峰值的特征)
  • 为Amazon S3连接添加可选的自定义端点参数。这使您能够使用与S3 API兼容的存储服务,而不是Amazon S3。
  • 部署/模型操作:
    • 所有自定义预测模型现在都支持在模型操作中,即除了Auto model模型之外,用Design视图创建的模型
    • 现在还支持分组模型,允许将预处理模型与预测模型组合在一起
    • 部署中的模型模拟器现在使用原始数据列作为输入,并动态执行数据准备
    • 提供设置如果分数需要解释(大约100倍快没有),新的部署将默认禁用,现有部署启用
    • 显示分数是否应该在总览表中解释
    • 模型操作初始化发生在后台-不再阻止UI启动RM如果远程位置不可用(不再)
    • 模型操作的一些速度改进(从repo加载的对象更少,这使得远程部署更快一些
  • 模型模拟Operator现在也支持分组模型

增强

  • 到外部数据源(如Cassandra或MongoDB)的连接现在被正确地重用(在合理的范围内),并在进程结束时关闭。这将导致在使用循环构造时减少到外部数据源的连接,以及在进程结束后适当关闭的连接。
  • Windows和OS X版本现在附带OpenJDK(版本8u232)
  • 为JDBC连接添加了新的时区参数。注意:数据库中的日期处理(通常)是一个棘手的主题,在这样做的时候有很多方法会出错。一些数据库/JDBC驱动程序也不能正确地实现日期处理。最后但同样重要的是,请记住date_time/date是一个固定的时间点,但是当它以一种比“毫秒since 01-01-1970 UTC”更易于阅读的格式显示时,显示字符串将该时刻转换为您的显示时区。因此,即使一个日期是UTC的1月13日,在澳大利亚查看它时,由于显示时区偏移,您可能会看到1月12日。但是实际时间点(从UTC 01-01-1970毫秒开始)是相同的。看到文档获取更多信息。
  • 当用Nominal to Date解析字符串时,相关的时间戳现在表示1970年1月1日的时间,而不是1970年2月1日
  • 添加默认的用户代理设置为首选项/系统
  • 更新MariaDB JDBC驱动程序
  • 现在,在查看“关于”对话框时,您可以看到正在使用的Java版本
  • 改进了当时间序列操作符的时间序列属性选择为空时的元数据警告
  • 增加了自动检测Amazon S3连接中的S3区域的选项
  • 改进了谷歌云服务连接UI
  • OS X上的文件选择器图标现在也支持HiDPI
  • 当删除存储库时,repository.xml文件现在会立即更新
  • 可视化:Tick interval输入字段现在允许为datetime轴设置更大的值,因为它使用毫秒作为单位来分割块
  • 更新了产品内逐步教程内容
  • 为各种性能和聚合操作符添加了更多搜索标记
  • 改进了从远程存储库下载/反序列化数据时的错误消息
  • 改进了尝试连接RM服务器存储库时SSL证书无效的错误消息。
  • 改进了试图连接到RM服务器时的日志记录和不寻常的异常发生,例如,关于SSL连接失败的更多细节,网络问题是什么,等等。

修正

  • 修正了可能导致工作室停止启动并永远停留在启动画面的问题。
  • 修复了使用自动创建的主键无法在数据库中存储数据集的问题。
  • 声明缺失值如果选择表达式模式并且表达式本身返回一个缺失值,则不再崩溃。相反,它将计算为false,因此不会为该行设置一个缺失值。
  • 修正了来自扩展的模型和其他ioobject在服务器存储库中不能正确识别。
  • 固定的汽车模型不能使用的结果加入在某些情况下是操作员。
  • 修复了在极少数情况下存储数据表时损坏的属性。
  • 不能再使用无效的名称创建RapidMiner服务器存储库。
  • 滤波器的例子现在正确解析参数中的所有宏,包括自定义筛选器属性名。
  • 修正了有时会导致结果表无法通过“结果”选项卡中的按钮移动到“自动模型”的错误。
  • 修正了导致可视化在某些Linux系统上不出现的问题。
  • 修复了OS X上的文件选择器图标。
  • 修正了在部署中评分的错误:如果列类型不兼容,它们现在实际上被删除了(这是有记录的,但没有发生)
  • 如果用户通过关闭部署对话框取消部署,Auto Model现在将恢复

其他

  • 在RapidMiner 9.3中,不再可以创建遗留连接和其他已被新的存储库连接对象替换的连接。现有的连接仍然可以编辑和使用,但这个功能最终也将被删除。确保将现有的遗留连接迁移到存储库连接对象!看到文档供参考。

发展

  • 为连接添加缓存ConnectionAdapterHandler减少连接数,并在不再需要连接后(例如,过程结束)提供清理连接的可能性。
  • GlobalSearch不再在无头模式下可用(即命令行,作业容器执行等)