RapidMiner Studio 9.9.0有什么新功能?
发布:2021年3月24日
以下部分描述了RapidMiner Studio 9.9.0中的新特性:
新功能
- 数据是任何RapidMiner进程的核心部分。在这个版本中,RapidMiner内部处理数据的方式发生了根本性的变化,有了新的数据核心(代号Belt)。其新的柱状表表示为RapidMiner进程在处理速度和内存效率方面提供了一个量子飞跃。多个操作符已经在内部使用它,现在扩展开发人员可以完全使用它来创建快速高效的操作符。
- 增加了一个设置正值新数据核心的操作符,可以使标称属性为二名属性或改变二名属性的正值
增强
- 取代了按样例重命名操作人员采用新的改进版本
- 取代了重命名操作符,该操作符还可以处理重命名字典
- 取代了排序可以按多个属性排序的操作符(目前已经是操作符工具箱扩展的一部分)
- 提高了FP-Growth运算符,使其仅适用于为虚拟编码列中的项显式定义的正值(通过二名属性或正值参数)
- 提高内存消耗交叉验证在某些情况下
- 运营商读CSV而且读取Excel改进以使用新的数据核心
- 主现在支持数值属性的最少和模式聚合
- 注释现在也将注释添加到元数据中
- 增加了在AI Hub上运行流程时的警告,其功能版本低于当前Studio版本
- 在启动后的对话框中显示不兼容的扩展时增加了一个原因,以显示扩展加载失败的原因。详细信息可通过工具提示。
- 升级集成铬到版本84
- 改进了一些元数据转换w.r.t.标称值集
- 如果安装了多个扩展,启动时溅屏不再显示重复的扩展图标
- 可视化现在还支持数值属性的最少和模式聚合
- 改进了一些极端情况下的并发执行
- 弃用的交换角色操作符
- 模型查看器梯度增强树模型现在尊重工作室首选项中的数字格式设置
- Auto Model使用新的聚类算法,不再需要对数据集进行一次性编码,因此减少了具有多个值的标称列的数据集的内存占用。因此,用户不能再在x均值情况下指定最小簇数(自动确定最优簇数)。最小值现在固定为2。
- 时间序列:将选项添加到忽略无效值到移动平均滤波器operator:无效值(缺失,正无穷大和负无穷大现在在计算过滤值时被忽略
- 这还会在过滤后的时间序列的开始和结束处产生有效值
- 随着经典的分解和功能和季节成分预测是基于移动平均过滤器,现在也有“忽略无效值”选项
修正
- 固定数据表读取/写入时,LFS轻签启用
- 修正了当使用日期/时间属性的值在遥远的将来/过去时可能会发生未捕获的异常的问题
- 修正了进程运行时可能发生的未捕获异常执行过程失败,用户通过弹出窗口打开它,并在解决问题后直接运行它
- 修正了错误的属性权重随机森林回归
- 修复错误商店在应用k-Means模型后使用算子
- 修复了如果提供了通配符(.*)过滤器,保存对话框不接受任何选择的问题写文档)
- 修正Pivot元数据列名与实际数据不匹配的问题
- 修复了项目中文件恢复确认对话框的缺失文本
- 修正了一个可能导致Studio启动无声失败的问题
- 修正了一些操作符在启动w.r.t端口前置条件时可能出现的错误
- 修正了一个可能导致项目创建不显示错误并且似乎什么都不做的错误
- 删除了自定义模型的模型部署中预处理模型的检查。这已经导致某些分组模型失败,如果它们包含的模型在技术上不是预处理模型(例如PCA)。
- 时间序列:修正了一个错误滞后操作符,这也会导致在前面的端口上更改原始数据
- 时间序列:修复了两个教程过程描述中的一些小错误滑动窗口验证
- 时间序列:修正了在基于时间的窗口中,当最后一个窗口的结束等于输入数据中的最后一个时间戳时发生的错误。这将影响所有窗口操作符(窗口,窗口过程,预测验证,滑动窗口验证).
- 云连接:文件浏览器现在在Windows上添加正确的路径分隔符字符,并正确解析AWS、Azure和谷歌云文件操作符的宏
发展
新数据核
- ExampleSet而且ExampleSetMetaData已正式弃用!从现在开始,任何新的操作员都应该使用Belt Tables (com.rapidminer.belt.table.Table).显然,使用ExampleSets的现有操作符暂时还可以继续工作。请参阅以下资源寻求帮助:乐鱼体育安装
表/示例集现在作为IOTable从非遗留存储库中检索,TableMetaData作为元数据。类似于下面的内容将不再有效:
IOObjectEntry dataEntry = dataLoc.locateData();if (!ExampleSet.class.isAssignableFrom(dataEntry.getObjectClass())){返回false;}元数据元数据= dataEntry.retrieveMetaData();如果(!(metaData instanceof ExampleSetMetaData)){返回false;}……IOObject IOObject = dataEntry.retrieveData(null);如果(!(ioObject instanceof ExampleSet)){返回false;} exampleeset exampleeset = (exampleeset) ioObject; ...
而应该被
IOObjectEntry dataEntry = dataLoc.locateData();if (!IODataTable.class.isAssignableFrom(dataEntry.getObjectClass())){返回false;}元数据元数据= dataEntry.retrieveMetaData();exampleesetmetadata esMD = beltconversiontools . asexampleesetmetadataornull(元数据);if (esMD == null){返回false;}……IOObject IOObject = dataEntry.retrieveData(null);exampleeset exampleeset = beltconversiontools . asexampleesetornull (ioObject);if (exampleeset == null){返回false;}……
端口上的元数据现在可以是TableMetaData。所有元数据转换将继续工作,因为端口# getMetaData ()自动转换TableMetaData来ExampleSetMetaData但该方法已被弃用,应由端口# getMetaData (ExampleSetMetaData.class)或端口# getMetaDataAsOrNull (ExampleSetMetaData.class)如果可能,自动转换为所需的类。这些新方法与数据方法类似,例如:端口# getAnyDataOrNull (),它在9.4中已经弃用,应该由端口# getDataAsOrNull (ExampleSet.class)如果可能,自动转换为所需的类。虽然端口上的数据方法没有任何改变,但现在有更多的操作符来交付IOTable而不是ExampleSet到9.9版本的端口。运营商读CSV而且读取Excel改进后使用新的数据核心;如果您使用相应的类CSVExampleSource或ExcelExampleSource在某种形状或形式,请使用CSVTableSource而且ExcelTableSource在未来。
扩展日志I18N
日志现在也支持i18n!要做到这一点,请遵循以下步骤之一:
- 对于一个RapidMiner扩展:添加一个LogMessagesXYZ.properties旁边有你存在的地方UserErrorMessages.propertiesEtc文件。仅Studio 9.9+支持,早期Studio版本忽略。
- 使用日志模块时,只需注册您的LogMessagesXYZ.properties通过com.rapidminer.tools.I18N # registerLoggingBundle (ResourceBundle)