数据上采样与蟒蛇熊猫

Katharina_MULKatharina_MUL 成员职位:1学我
2019年7月编辑 帮助

你好,

所以我有个小问题。我想在RapidMiner中用python pandas上传我的数据(时间戳+9属性)。在Jupyter中,它工作得很好,但是一旦我在“执行Python”操作符中使用代码,它就不起作用了。在结果中,有一个缺失的值,我的时间戳也不见了。

一个大问题可能是时间戳。格式为“YYYY-MM-dd HH:mm:ss”。SSS”,我想把数据采样到100毫秒。RapidMiner不会显示格式,因为它切断了毫秒。

你有什么主意吗?

谢谢!

Jupyter代码:

以pd方式导入熊猫
df = pd.read_csv('aufgefuel .csv', header=0, sep =';', parse_dates=True)
df['Datum'] = pd。to_datetime (df(“基准”),格式= ' % d - Y % m - % % H: % m: % s % f ')
df.set_index(“基准”)
df1 = df.reset_index () .set_index(基准面).resample(0.1秒).mean ()
德尔df1(“指数”)
df2 = df1

RapidMiner中的代码:

以pd方式导入熊猫
def rm_main(数据):
Data ['timestamp'] = pd。to_datetime(数据(“时间戳”),格式= ' % Y - % m - H % d %: % m: % s % f ')
df1 = data.reset_index().set_index('timestamp').resample('0.1S').mean()
返回df1

标记:
    登录注册置评。