每个循环的属性子集和日志结果
你好,
我的数据集中有一堆属性/特征,我想找出哪种特征组合能训练出最好的模型。
因此,我使用LoopSubsets操作符。我将它指定为“min number of attributes”= 2,所以我将在每个循环中至少获得一个特征和标签。我使用分支操作符来检查特征的组合是否包含我的标签,然后在“then”分支中继续训练一个模型,并使用“log”操作符记录性能。
我得到的结果与我在一个特征子集上单独训练模型时得到的训练结果不匹配,绝对误差为10倍。我有一个假设,要么“子集”操作符做了一些我不期望的事情,要么循环内的日志操作符不像在循环外那样工作。
如何在循环中记录结果(模型的性能或整个预测示例集)?
这是我的日志。我希望绝对误差<0.1:
这是我的过程:
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
我的数据集中有一堆属性/特征,我想找出哪种特征组合能训练出最好的模型。
因此,我使用LoopSubsets操作符。我将它指定为“min number of attributes”= 2,所以我将在每个循环中至少获得一个特征和标签。我使用分支操作符来检查特征的组合是否包含我的标签,然后在“then”分支中继续训练一个模型,并使用“log”操作符记录性能。
我得到的结果与我在一个特征子集上单独训练模型时得到的训练结果不匹配,绝对误差为10倍。我有一个假设,要么“子集”操作符做了一些我不期望的事情,要么循环内的日志操作符不像在循环外那样工作。
如何在循环中记录结果(模型的性能或整个预测示例集)?
这是我的日志。我希望绝对误差<0.1:
这是我的过程:
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.10.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
< /操作符>
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
<参数键= "属性" value = " F_angl [N] | F_anw [N] | T_Heiz(°C) | weld_factor | WS_Int(µVs) " / >
/> .
< /操作符>
<过程扩展= " true " >
<过程扩展= " true " >
<列出关键= " set_additional_roles " / >
< /操作符>
<枚举关键= "分区" >
< /枚举>
< /操作符>
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
/> .
< /操作符>
<列出关键= "日志" >
/> .
.
. .
. .
.
.
< /操作符>
/> .
> < /过程
<过程扩展= " true " >
> < /过程
< /操作符>
> < /过程
< /操作符>
/> .
> < /过程
< /操作符>
> < /过程
0
最佳答案
-
MartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3291年RM数据科学家你好,你查过自动特征工程操作员了吗?这应该和你想做的很接近。
BR,马丁
- RapidMin乐鱼平台进入er数据科学服务主管-
德国多特蒙德0
答案
德国多特蒙德