夏季扩展更新
在我们发布RapidMiner 9.7之前不久,我们还自豪地宣布了我们扩展的最新更新运营商的工具箱而且转换器。
运营商的工具箱是我们为新的有用的操作员准备的地方。随着2.5版的发布。我们增强了一些现有的操作符,使它们更有用,并增加了读取word文件的支持。在转换器扩展我们添加了一个转换操作符来使用自动特征工程结合模型模拟器。
使用Read Doc读取Word文件(x)
新的操作符Read Doc(x)允许您读取word文件。它简单地允许您读取由MS Word创建的文档到RapidMiner。该操作符可以使用Fileobjects作为输入,因此您可以轻松地使用Loop Files循环遍历文档文件夹并将它们读入。
特征集和模型模拟器
自动特征工程是一种使你的模型更好的强大方法。以前使用特征工程的模型模拟器使用起来有点困难。它们显示的是转换后的新特征,而不是原来的特征。
新的操作符“FeatureSet to Model”允许您将FeatureSet从自动特征工程转换为预处理模型。您可能已经从Normalize等操作符中了解了预处理模型。你可以把这些模型和你的预测模型组合在一起,得到一个链式模型。
结果是一个模型模拟器,它使用了自动特征工程的结果,但它显示了工作的原始值:
用常量属性构建模拟
在最近的2.4更新中,我们将新的操作符构建模拟添加到操作符工具箱中。它允许您生成新的示例,这些示例具有与您训练的示例相同的统计属性。如果您出于数据隐私的原因需要生成伪示例,而且如果您想查看某些参数范围对模型的影响,这可能非常方便。
在新的更新中,我们添加了使某些属性为常量的选项。例如,这允许您仅为泰坦尼克号的三等舱乘客生成数据,同时仍然使用完整的数据集来训练您的模拟模型。
更好的SFTP支持
有两个新的操作符用于SFTP服务器。读SFTP和写SFTP取代旧的SFTP下载文件和SFTP上传文件。新的操作符可以使用新的连接管理框架在9.3版引入.
这两个操作符现在都支持HTTP代理。我们还改变了操作符的文件处理,这样您就可以以更通用的方式使用文件对象。
获取有关关联规则的更多信息
关联规则通常用于市场篮子分析。如果有人买了可乐和薯条,他可能也会买披萨。如果你想了解更多关于市场篮子分析,请查看我们的7月7日的闪电演示!
Apply Association规则操作符告诉您向此人提供Pizza。使用新的应用关联规则(详细),您可以获得关于为什么执行此建议的更多信息。您将获得所有适用的规则及其各自的统计信息。
德国多特蒙德