您正在查看9.7 -版的RapidMiner Studio文档点击这里查看最新版本
RapidMiner Studio 9.6.0有什么新功能?
发布:2020年2月26日
以下描述了RapidMiner Studio 9.6.0中修复的错误:
新功能
- 增加了复制/粘贴活动进程到进程工具栏的按钮。
- 均衡时间序列
- 新增两个运算符(均衡数值指标和均衡时间戳),提供均衡输入时间序列的功能。输出时间序列将具有新的等距索引值。操作符提供了不同的可能性来配置示例的数量、开始值和停止值以及新索引值的步长。通过使用替换缺失值(序列)操作计算输出时间序列的相应值。
- 均衡数值指标:将数值指标均衡为等距数值指标,并具有数值步长。
- 均衡时间戳:将日期-时间指数均衡为等距日期-时间指数。要么以精确的持续时间(毫秒精度)作为步长,要么以周期(数天、数周、数月或数年)作为步长。
- 峰值转换:
- 新增两个运算符(Z-Score峰值变换和最高峰值转换),对时间序列进行峰值检测和变换。它们检测时间序列中的峰值,并添加一个指示峰值序列(以-1,0,1作为峰值标志值)和一个峰值序列(如果检测到峰值,则为原始值,对于非峰值区域则为缺失值)。
- Z-Score峰值变换:通过计算局部均值和标准差进行峰值检测,当值与该局部均值偏差较大时,将其识别为峰值
- 最高峰值转换:对不同区域的时间序列进行分割,检查局部极小值和最大值是有效的峰值,还是只是噪声的影响,从而进行峰值检测。
- 峰特征提取:
- 新的操作符提取的山峰它执行峰值检测(通过使用一种新的峰值变换算子并提取描述峰值的特征)
- 为Amazon S3连接添加了可选的自定义端点参数。这使得您可以使用兼容S3 API的存储服务,而不是Amazon S3。
- 部署/模型操作:
- 除了Auto model模型外,所有自定义预测模型现在都支持模型操作,即使用Design视图创建的模型
- 现在还支持分组模型,它允许预处理模型与预测模型的组合
- 部署中的Model Simulator现在使用原始数据列作为输入,并动态地执行数据准备
- 提供设置,如果分数需要解释(没有分数大约快100倍),新部署将默认禁用此设置,现有部署将启用
- 显示分数是否应该在概述表中解释
- 模型操作的初始化现在在后台进行-如果远程位置不可用,不再阻塞RM的UI启动(不再)
- 模型操作的一些速度改进(从repos加载的对象更少,这使得远程部署的速度更快
- 模型模拟Operator现在还支持分组模型
增强
- 连接到外部数据源,如Cassandra或MongoDB现在被正确地重用(在合理的范围内),并在进程结束时关闭。在使用循环构造时,这将减少到外部数据源的连接,并在进程完成后适当关闭连接。
- Windows和OS X版本现在与OpenJDK(版本8u232)一起发布
- 为JDBC连接添加了新的时区参数。注意:数据库中的日期处理(一般来说)是一个棘手的主题,并且在这样做时有相当多的方法会出错。一些数据库/JDBC驱动程序也不能正确地实现日期处理。最后但并非最不重要的是,请记住date_time/date是一个固定的时间点,但是当它以比“milliseconds since 01-01-1970 UTC”更易于人类阅读的格式显示时,显示字符串将该瞬间转换为您的显示时区。因此,即使一个日期在UTC是1月13日,当你在澳大利亚查看它时,由于显示时区偏移,你可能会看到1月12日。然而,实际的时间点(从01-01-1970 UTC开始的毫秒)是相同的。看到文档获取更多信息。
- 当使用Nominal to Date解析字符串到time时,关联的时间戳现在表示1970年1月1日的时间,而不是1970年2月1日
- 添加默认的用户代理设置为首选项/系统
- 更新了MariaDB JDBC驱动程序
- 现在,在查看“About”对话框时,您可以看到正在使用哪个Java版本
- 改进了当时间序列算子的时间序列属性选择为空时的元数据警告
- 增加了在Amazon S3连接中自动检测S3区域的选项
- 改进了谷歌云服务连接UI
- OS X上的文件选择器图标现在也支持HiDPI
- 在删除存储库时,repository.xml文件将立即得到更新
- 可视化:刻度间隔输入字段现在允许为日期时间轴设置更大的值,因为它使用毫秒作为单位来分割块
- 更新了一步一步的产品教程内容
- 为各种性能和聚合操作符添加了更多的搜索标记
- 改进了从远程存储库下载/反序列化数据时的错误消息
- 改进了当尝试连接到RM服务器存储库时SSL证书无效时的错误消息。
- 改进了在尝试连接RM服务器和异常发生时的日志记录,例如关于SSL连接失败的更多细节,网络问题是什么,等等。
修正
- 修复了可能导致Studio停止启动并永远停留在启动画面的问题。
- 修复了无法使用自动创建的主键在数据库中存储数据集的问题。
- 声明缺失值如果选择了表达式模式并且表达式本身返回缺失值,则不再崩溃。相反,它将求值为false,因此NOT为该行设置一个缺失值。
- 修复了在服务器存储库中不能正确识别来自扩展的模型和其他对象。
- 修复了自动模型不能使用加入在某些情况下是操作符。
- 修复了在罕见情况下存储数据表时损坏的属性。
- 不再可能使用无效的名称创建RapidMiner服务器存储库。
- 滤波器的例子现在可以正确解析参数中的所有宏,包括自定义过滤器属性名。
- 修正了有时可能导致结果表无法通过Results选项卡中的按钮移动到Auto Model的错误。
- 修复了在某些Linux系统上无法显示可视化的问题。
- 修正了OS X上的文件选择器图标。
- 修复了部署中计分的错误:如果列类型不兼容,它们现在实际上会被删除(文档中是这样的,但没有发生)
- 如果用户通过关闭部署对话框取消部署,自动模型现在将被恢复
其他
- 在RapidMiner 9.3中,不能再创建遗留连接和其他已被新的存储库连接对象所取代的连接。现有的连接仍然可以被编辑和使用,但是这个功能最终也会被删除。确保将现有遗留连接迁移到存储库连接对象!看到文档供参考。
发展
- 为连接添加缓存ConnectionAdapterHandler减少连接数,并提供在不再需要连接后清理连接的可能性(例如,进程完成)。
- GlobalSearch在无头模式下不再可用(也就是命令行、作业容器执行等)