您正在查看9.9 -版的RapidMiner Studio文档点击这里查看最新版本
RapidMiner Studio 9.9.0有什么新功能?
发布:2021年3月24日
以下部分描述了RapidMiner Studio 9.9.0中的新功能:
新功能
- 数据是任何RapidMiner进程的核心部分。RapidMiner内部处理数据的方式在这个版本中已经从根本上改变了新的数据核心(代号Belt)。它的新柱状表表示为RapidMiner进程提供了处理速度和内存效率的巨大飞跃。多个操作符已经在内部使用它,扩展开发人员现在可以完全使用它来创建快速高效的操作符。
- 增加了一个设置正值操作符,该操作符可以将标称属性变为二名属性或更改二名属性的正值
增强
- 取代了按样例重命名操作符的一个新的和改进的版本
- 取代了重命名操作符由一个可以额外处理重命名字典的新操作符替换
- 取代了排序可以按多个属性排序的单个操作符(目前已经是“操作符工具箱”扩展的一部分)
- 提高了FP-Growth操作符,以便它仅对虚拟编码列中的项使用显式定义的正值(通过二项式属性或正值参数)
- 改进的内存消耗交叉验证在某些情况下
- 运营商读CSV和读取Excel是否经过改进以使用新的数据核心
- 主现在也支持数值属性的最小和模式聚合
- 注释现在还要向元数据添加注释
- 当尝试在AI Hub上运行一个功能版本低于当前Studio版本的进程时,增加了警告
- 增加了在启动后的对话框中显示不兼容扩展的原因,以显示扩展加载失败的原因。详细信息可通过工具提示。
- 集成Chromium升级到版本84
- 改进了一些元数据转换w.r.t.标称值集
- 如果安装了一个扩展的多个副本,则在启动期间飞溅屏幕不再显示重复的扩展图标
- 可视化现在还支持数值属性的最小和模式聚合
- 改进了某些极端情况下的并发执行
- 弃用的交换角色操作符
- 的模型查看器梯度增强树models现在尊重Studio preferences中的Number格式设置
- Auto Model使用新的聚类算法,不再需要对数据集进行单热编码,因此减少了具有许多值的标称列的数据集的内存占用。因此,用户不能再指定X-Means情况下的最小簇数(自动确定最优簇数)。最小值现在固定为2。
- 时间序列:增加了选项忽略无效值到移动平均滤波器运算符:无效值(缺失、正无穷大和负无穷大)现在在计算过滤值时被忽略
- 这也会在过滤的时间序列的开始和结束处产生有效值
- 随着经典的分解和功能及季节成分预测基于移动平均过滤器,现在也有“忽略无效值”选项
修正
- 固定数据表读取/写入时,LFS轻检启用
- 修复了当使用具有遥远未来/过去值的日期/时间属性时可能会发生未捕获异常的问题
- 修复了进程运行时可能发生的未捕获异常执行过程失败,用户通过弹出窗口打开,修复问题后直接运行
- 修正了错误的属性权重随机森林回归
- 修复了商店k-Means模型应用后使用的算子
- 修复了如果提供了通配符(.*)过滤器(例如for .*),保存对话框不接受任何选择的问题写文档)
- 固定Pivot元数据列名不匹配的实际数据
- 修复了项目中文件恢复确认对话框缺少的文本
- 修复了一个可能导致Studio启动静默失败的问题
- 修正了一些操作符在启动wrt端口前提条件时可能出现的错误
- 修复了一个可能导致项目创建不显示错误并且看起来什么都不做的错误
- 删除了自定义模型的模型部署中对预处理模型的检查。这已经导致某些分组模型失败,如果它们包含的模型在技术上不是预处理模型(例如PCA)。
- 时间序列:修复了一个错误滞后操作,导致前面端口的原始数据也发生了变化
- 时间序列:修正了两个教程过程描述中的一些小错误滑动窗口验证
- 时间序列:修正了在基于时间的窗口中发生的错误,即最后一个窗口的结束等于输入数据中的最后一个时间戳。这将影响所有窗口操作符(窗口,窗口过程,预测验证,滑动窗口验证).
- 云连接:文件浏览器现在在Windows上添加了正确的路径分隔符,并正确解析AWS、Azure和Google Cloud文件操作符的宏
发展
新数据核心
- ExampleSet和ExampleSetMetaData已正式弃用!从现在开始,任何新的操作符都应该使用带式表(com.rapidminer.belt.table.Table).显然,现有的带有ExampleSets的操作符暂时还会继续工作。请参阅以下参考资料获取帮助:乐鱼体育安装
表/ExampleSets现在作为IOTable从非遗留存储库中检索,TableMetaData作为元数据。类似于下面的东西将不再工作:
IOObjectEntry dataEntry = dataLoc.locateData();if (!ExampleSet.class.isAssignableFrom(dataEntry.getObjectClass())){返回false;} MetaData MetaData = dataEntry.retrieveMetaData();如果(!(metaData instanceof ExampleSetMetaData)){返回false;}……IOObject = dataEntry.retrieveData(null);如果(!(ioobjectinstanceof ExampleSet)){返回false;} ExampleSet ExampleSet = (ExampleSet) ioObject; ...
并且应该被
IOObjectEntry dataEntry = dataLoc.locateData();if (!IODataTable.class.isAssignableFrom(dataEntry.getObjectClass())){返回false;} MetaData MetaData = dataEntry.retrieveMetaData();exampleesetmetadata esMD = beltconverversiontools . asexampleesetmetadatornull (metaData);if (esMD == null){返回false;}……IOObject = dataEntry.retrieveData(null);ExampleSet = beltconverversiontools . asexamplesetornull (ioObject);if (exampleSet == null){返回false;}……
端口上的元数据现在可以是TableMetaData。此后,所有元数据转换将继续工作端口# getMetaData ()自动转换TableMetaData来ExampleSetMetaData但是该方法已被弃用,应该由端口# getMetaData (ExampleSetMetaData.class)或端口# getMetaDataAsOrNull (ExampleSetMetaData.class)如果可能的话,它会自动转换为所需的类。新方法类似于数据处理方法,例如:端口# getAnyDataOrNull (),它在9.4中已经弃用,应该被端口# getDataAsOrNull (ExampleSet.class)如果可能的话,它会自动转换为所需的类。虽然港口的数据方法没有改变,但现在有更多的运营商提供数据IOTable而不是ExampleSet9.9的端口。运营商读CSV和读取Excel经过改进,可以使用新的数据核心;如果使用相应的类CSVExampleSource或ExcelExampleSource在某种形状或形式中,请使用CSVTableSource和ExcelTableSource在未来。
扩展日志I18N
日志记录现在也支持i18n!要做到这一点,请遵循以下步骤之一:
- 对于RapidMiner扩展:添加一个LogMessagesXYZ.properties旁边有你存在的地方UserErrorMessages.propertiesEtc文件是。仅受Studio 9.9+支持,早期Studio版本忽略。
- 使用日志模块时,只需注册您的LogMessagesXYZ.properties通过com.rapidminer.tools.I18N # registerLoggingBundle (ResourceBundle)