Web挖掘,通过浏览提供的日历得到数值数据

felix_wfelix_w 成员职位:61因素二世
2019年9月编辑 帮助

亲爱的Rapidminer社区:

直到最近我才发现RM也提供网站挖掘运营商,这对我有很大的帮助!

但不幸的是,当我试图从这个网页下载数据时,我遇到了一个问题

https://www.eex.com/en/market-data/power/spot-market/auction !/ 2018/01/03

我想下载所有小时数据00-01等特定时间(例如2015年1月1日至2017年9月30日),但我只能通过手动更改网站上提供的日历中每天的日期来做到这一点,这不是很方便。

我现在的问题是,在RM中是否有任何方法可以配置网络爬虫自动通过日历并绘制每小时的数据?

我希望你能帮助我解决我的问题。

致以最亲切的问候

费利克斯

答案

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    这可能确实很棘手。我不认为RapidMiner的网络爬虫可以做到这一点,你可能不得不求助于一些外部脚本(如node.js)。您可以使用Execute Program操作符调用脚本,更改日期,加载新页面,然后运行RM爬虫。

    sgenzer felix_w
  • felix_wfelix_w 成员职位:61因素二世

    谢谢您的回复!我已经想到这可能有点棘手;)

登录注册置评。