每个循环的属性子集和日志结果

JonesFoxJonesFox 成员职位:5新手
你好,
我的数据集中有一堆属性/特征,我想找出哪种特征组合能训练出最好的模型。

因此,我使用LoopSubsets操作符。我将它指定为“min number of attributes”= 2,所以我将在每个循环中至少获得一个特征和标签。我使用分支操作符来检查特征的组合是否包含我的标签,然后在“then”分支中继续训练一个模型,并使用“log”操作符记录性能。

我得到的结果与我在一个特征子集上单独训练模型时得到的训练结果不匹配,绝对误差为10倍。我有一个假设,要么“子集”操作符做了一些我不期望的事情,要么循环内的日志操作符不像在循环外那样工作。

如何在循环中记录结果(模型的性能或整个预测示例集)?


这是我的日志。我希望绝对误差<0.1:


这是我的过程:

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.10.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
.
.
<过程扩展= " true " >
.
< /操作符>
.
< /操作符>
.
.
.
.
.
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
<参数键= "属性" value = " F_angl [N] | F_anw [N] | T_Heiz(°C) | weld_factor | WS_Int(µVs) " / >
/> .
< /操作符>
.
.
.
.
<过程扩展= " true " >
.
.
.
<过程扩展= " true " >
.
<列出关键= " set_additional_roles " / >
< /操作符>
<枚举关键= "分区" >
< /枚举>
.
.
< /操作符>
.
.
.
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
/> .
.
.
.
.
< /操作符>
<列出关键= "日志" >
/> .
< /操作符>
/> .
.
. .
> < /过程
<过程扩展= " true " >
. .
> < /过程
< /操作符>
> < /过程
< /操作符>
/> .
.
.
> < /过程
< /操作符>
> < /过程

最佳答案

  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3291年RM数据科学家
    解决方案接受
    你好,
    你查过自动特征工程操作员了吗?这应该和你想做的很接近。

    BR,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德

答案

  • JonesFoxJonesFox 成员职位:5新手
    自动特征工程操作符似乎很适合我的目的,谢谢!然而,它没有免费版…
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3291年RM数据科学家
    你查过我们的教育offer了吗?感觉你是有资格的。

    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
登录注册置评。