数据上采样与蟒蛇熊猫


你好,
所以我有个小问题。我想在RapidMiner中用python pandas上传我的数据(时间戳+9属性)。在Jupyter中,它工作得很好,但是一旦我在“执行Python”操作符中使用代码,它就不起作用了。在结果中,有一个缺失的值,我的时间戳也不见了。
一个大问题可能是时间戳。格式为“YYYY-MM-dd HH:mm:ss”。SSS”,我想把数据采样到100毫秒。RapidMiner不会显示格式,因为它切断了毫秒。
你有什么主意吗?
谢谢!
Jupyter代码:
以pd方式导入熊猫
df = pd.read_csv('aufgefuel .csv', header=0, sep =';', parse_dates=True)
df['Datum'] = pd。to_datetime (df(“基准”),格式= ' % d - Y % m - % % H: % m: % s % f ')
df.set_index(“基准”)
df1 = df.reset_index () .set_index(基准面).resample(0.1秒).mean ()
德尔df1(“指数”)
df2 = df1
RapidMiner中的代码:
以pd方式导入熊猫
def rm_main(数据):
Data ['timestamp'] = pd。to_datetime(数据(“时间戳”),格式= ' % Y - % m - H % d %: % m: % s % f ')
df1 = data.reset_index().set_index('timestamp').resample('0.1S').mean()
返回df1
标记:
0