每个ID的移动平均值
Cristina_daimiel
成员职位:2新手
在帮助
你好所有的,
我有一个数据集,其中包含了几个光伏电站在1年内每15分钟产生的能量。因此,我有一个带有日期时间的列(每个ID大约18000个示例),另一个带有ID的列(每个光伏电站有不同的ID,总共有4个ID)和产生的能量。对于每个例子,我都在用操作符“移动平均过滤器”计算前3小时的移动平均。但是,当第一个ID的第一年结束时,对于第二个ID,移动平均线是计算前一个ID最后3小时的平均值,而不是从头开始计算。有没有办法让我把ID考虑进去做这个计算?或者我是否应该将示例集分离为4个不同的示例集(每个ID一个)并分别进行计算?
非常感谢
我有一个数据集,其中包含了几个光伏电站在1年内每15分钟产生的能量。因此,我有一个带有日期时间的列(每个ID大约18000个示例),另一个带有ID的列(每个光伏电站有不同的ID,总共有4个ID)和产生的能量。对于每个例子,我都在用操作符“移动平均过滤器”计算前3小时的移动平均。但是,当第一个ID的第一年结束时,对于第二个ID,移动平均线是计算前一个ID最后3小时的平均值,而不是从头开始计算。有没有办法让我把ID考虑进去做这个计算?或者我是否应该将示例集分离为4个不同的示例集(每个ID一个)并分别进行计算?
非常感谢
标记:
0
最佳答案
-
MartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3345年RM数据科学家您可以使用Group into Collection来分割示例集,然后使用Loop Collection对每个植物进行分割。有几种方法可以做到这一点,但这是我的方法。附件是一个例子。
我能问一下你在做什么项目吗?这听起来很酷。
最好的马丁
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.6.000”>
<上下文>
<输入/ >
<输出/ >
<宏/ >
> < /上下文. .
<过程扩展= " true " >
<过程扩展= " true " >.
<过程扩展= " true " >
<列出关键= " function_descriptions " >.
< / >列表
<列出关键= " numeric_series_configuration " / >
<列出关键= " date_series_configuration " / >
/> .. .
< /操作符>.
/> .
< /操作符>
/> ..
> < /过程
< /操作符>
< /操作符>. .
> < /过程生成虚拟数据
< /操作符>. 分成5个样本集,每个样本集一个植物
< /操作符>.
<过程扩展= " true " >. . . . . . .
< /操作符>
> < /过程做每株植物的移动平均
< /操作符>. .
> < /过程
< /操作符>
> < /过程
- RapidMin乐鱼平台进入er数据科学服务主管-
德国多特蒙德5
答案
在循环Connection操作符之后,示例集被分割为IOObjectcollection中的4个不同的数据集(每个PV电站一个)。你知道我如何将数据再次组合到相同的示例集中吗?
我正在做的这个项目的目标是预测光伏电站的故障。为此,我有来自不同变量的数据,以及每15分钟和一整年的环境条件(辐照、温度、湿度等)。
德国多特蒙德