RapidMiner Studio 9.3.0有什么新功能?
发布:2019年5月28日
以下描述了RapidMiner Studio 9.3.0的bug修复:
新功能
完全重做了连接(JDBC,以及任何其他连接,如Twitter, Amazon S3, Dropbox等)的工作方式:
- 连接现在是自包含的,并存储在每个存储库中。这意味着当您创建连接时,使用它所需的一切都将成为存储库中连接条目的一部分。
- 当涉及到动态注入连接的某些设置时,我们通过添加所谓的值源增加了很大的灵活性。设置可以是凭据、url(或url的一部分)和其他参数。对于初学者来说,只有Macro和RM Server Vault可以作为源,但是这个列表会随着时间的推移而增长,因为任何扩展都可以添加自己的源!
- 有一个中央数据库连接,每个用户都应该使用自己的凭据?在RM Server上创建单个连接模板,指示凭据被注入,然后使用我们的新RM Server Vault作为源,每个用户可以安全地存储他们的凭据!
- 现在,您可以通过服务器轻松地与同事共享连接。
- 它们还可以在任何执行节点上工作,而无需您自己手动向所有节点添加JDBC驱动程序。
- 总而言之,现在的联系比以前强大得多。它们不再是静态定义的,而是可以在运行时动态更改,以获取最新的凭据、令牌等。当然,您仍然可以将所需的所有内容放入连接并使用它。
- 并不是所有新连接的特性都可以通过UI访问。对于非常高级和强大的功能,如链接不同的值提供程序以进行注入(例如Server Vault→CyberArk→DB)或使用(可注入的)占位符来构建其他密钥的值,管理员可以手动创建连接(毕竟它是ZIP存档)。他们可以创建配置JSON来满足他们的需求,然后将ZIP上传到RM Server。这与注入机制一起使连接模板成为现实,允许管理员大规模管理连接,利用命令行工具构建和分发连接。
- 连接及其源的整个机制是高度可扩展的,新的源和连接类型可以很容易地通过扩展添加。我们预计在接下来的几个月里会有大量新的连接和资源。
自动模型现在可以在RapidMiner服务器上执行,而不是在本地
- 用户可以选择是在RapidMiner Studio本地执行,还是将进程推送到连接的服务器。后者允许关闭RapidMiner Studio并稍后从Server实例获取结果。
- 可以将作业添加到用户可以访问的任何队列中。
- 结果将存储在服务器上,并可以在完成后加载回Auto Model。还支持加载部分结果。
- 如果在服务器上执行时保持RapidMiner Studio打开,结果将被动态加载,并显示进度。在这种情况下,还可以停止所有远程进程的执行。
时间序列分析特点:
- 新的默认预测模型
- 对所有未来值始终预测相同的预测值
- 是否可作为基准模型,与其他预测模型作比较
- 新运营商默认预测
- 训练默认预测模型
- 预测值可以通过末值、窗内均值、窗内中值或窗内众数来计算
- 窗口中的最后值和模式甚至可以用于创建标称时间序列的预测模型
- 新功能和季节预报模型
- 通过评估多项式函数来预测时间序列的趋势,从而预测未来的值
- 将季节分量的值与预测趋势值相加或相乘
- 新的操作员功能和季节性成分预测
- 训练函数和季节预测模型
- 操作者执行分解(经典分解或STL分解)来确定输入时间序列的趋势和季节成分
- 对趋势分量拟合一个多项式函数
- 将函数和季节分量作为函数和季节预报模型提供给模型输出端口
- 新算子自相关/自协方差
- 计算输入时间序列的依赖函数(自相关函数,自协方差,部分自相关函数)
- 新的默认预测模型
增强
- 写Excel现在支持创建多个工作表。属性指定工作表名称表的名字参数
- 写Excel现在支持示例集集合作为输入
- 添加关闭所有其他结果结果选项卡的操作,在右键单击弹出式菜单中找到
- 改进了对未设置的强制参数的处理
- 加载的存储库条目中的元数据检索操作符被标注了存储库位置
- 添加提出宏观复选框计划过程哪一种方法允许您将当前所有宏从调用进程转发到计划进程
- 写数据库现在默认批量大小为100
- 运营商地图,取代和通过替换重命名现在有一个更方便的regex对话框,它也可以存储替换值
- 下添加新功能先进的功能命名属性(名义attribute_name)到表达式解析器.该函数计算输入并检索属性的值,该属性的名称由(已解析的)输入指定。
- 增加了一个新选项作为属性插入用于在表达式解析器的UI中插入宏(例如for生成属性).
- 改进的元数据名义到二项式对于标称映射没有明确定义的属性
- 解释预测现在提供了基于每个属性值对局部解释的支持和矛盾程度的模型特定全局权重的计算
- Turbo Prep现在使用新的可视化图表视图
- Auto Model现在跟踪更多的运行时间,除了总流程执行运行时间外,还包括为1,000行评分和在1,000行上训练模型所需的时间。概览表还显示了小徽章,指出了最好和最快的车型
- Auto Model现在提供在本地执行结束时保存所有结果的功能。可以加载这些结果,而不必重新运行建模
- 作为第一步的一部分,Auto Model现在提供了最近数据集的列表以及最近结果的列表
- Auto Model现在提供覆盖文本处理的列选择
- Auto Model现在显示了在运行期间创建的模型的数量,评估的特性集的数量,以及生成的特性的数量
- 模型中与模型无关的全局权重之外,Auto Model现在还显示了每个模型的所有属性的重要性一般结果部分
- 可视化:气泡图(散点与大小列)现在可以显示超过5000个数据点
- 可视化:Scatter3D现在还支持数字颜色列
- 可视化:散点矩阵现在也支持数字或日期时间颜色列
- 可视化:添加了高度要求的颜色组选项线/条形/列/区域/流图绘图。该列中的每个不同的值都成为一个单独的绘图元素,以便在不旋转的情况下轻松地对数据进行逻辑分组。列可以是任何类型。
- 可视化:聚合group by现在还支持数值列,它将获取每个不同的数字并将其转换为类别
- 可视化:如果group by列是数字或日期时间,组现在按升序排序
- 可视化:x轴列和按列聚合组现在是链接的,即更改一个也会更改另一个。这使得聚合/不聚合之间的切换更直观,更容易遵循
- 移动平均滤波器现在提供了单独指定简单过滤器的左右两侧,而不是对称的
- 改进的操作员帮助循环的例子
- 添加了一个正类参数性能(二项分类)这让用户手动决定什么是正类。
- 可视化:启用了聚合的热图现在还可以同时按两个列分组,从而产生一个2D表格结构,其中两个分组列的每个值组合都包含单元格。如果要绘制多个值列,仍然可以像以前一样按单个列分组。
- 复制/粘贴的操作符如果引用了其他复制的操作符,现在将正确地更新其参数。
- 当替换一个操作符时,两个操作符之间共享的参数将被保留。
- 存储库条目副本现在简单地在其名称的末尾枚举,而不是突然以“Copy of”开头。这将使在大型存储库中查找副本更加简单
- 现在可以直接就地复制存储库条目,而不必首先选择目标文件夹
- 更新默认的Oracle jdbc驱动类
修正
- 修复了一个罕见的错误日志一个进程在完成后似乎没有停止的操作符
- 修复了一个罕见的会冻结UI的bug
- 切换选项卡现在只能通过左键点击
- 修复了一些数据库(如MySQL)参数中的模式检索
- 修正了通过新数据核心创建示例集时自动稀疏性检测中的罕见异常
- 修正了在启动与学院全局搜索条目相关的工作室时可能发生的错误
- 固定错误信息显示在表达式属性对话框非常长的错误
- 固定实数到整数当遇到无穷大值时
- 修复了比较民国这在某些情况下删除了输入示例集中的预测/置信度列
- 中的整数和实列分组属性的非有限值的固定处理主
- 修复了当宏排序顺序在上下文面板更改时,一个空宏已经在上下文中,并且用户尝试添加另一个宏
- 修复了在同一台机器上在Win32和Win64版本之间切换时可能导致Studio无休止启动的问题
- 固定链接到教育材料在汽车模型和涡轮准备
- 修复了可能发生的罕见错误自动特征工程如果特征生成与高复杂性设置结合H2O模型
- 可视化:OS X 10.11将再次支持HTML5可视化
- 可视化:固定矩阵数据(如相关矩阵)可视化显示错误的图表类型
- 可视化:固定Scatter3D点有时不显示
- 修正了没有抛出正确异常的罕见情况提取聚合,提取模式和提取系数(多项式拟合)
- 的内部“模型”端口的固定预期输入预测验证
- 修复的运行时问题替换缺失值(系列)
- 固定的检索操作符用于在删除或创建存储库条目后更新输出元数据
- 删除未使用的值现在还对没有未使用值的映射进行排序
- 链接按钮图标在macOS上不再像素化
- 可视化:Wordcloud现在在限制检查时考虑不同单词的实际数量,而不是计算实际没有出现的单词
- 关于取消带有相关任务的Progress线程的对话框现在显示在Progress对话框的前面
- 它不能再发生,进度线程仍然显示在进度对话框中,即使他们已经完成
发展
- 新增SwingTools#setPrompt(String, JTextComponent)方法,可用于在文本字段中设置提示(当字段为空时显示灰色帮助文本)
- 增加了com. rapidminerer .gui.actions. copystringtoclipboardaction,可以用来复制任何动态提供的字符串到系统剪贴板
- com.rapidminer.gui补充道。setDependencyPopups方法来防止弹出窗口询问是否终止具有依赖任务的Progress线程