从网页上的HTML表中读取数据

FlixportFlixport 成员职位:33因素二世
嘿,有没有从新版本中删除操作符HTML Reader,或者为什么我找不到它?
如果有人回答我就太好了,谢谢。

最佳答案

答案

  • FlixportFlixport 成员职位:33因素二世
    你好@varunm1

    据我所知,Web Table Extraction从HTML表中提取数据。但我们感兴趣的数据往往不是表格。有解决办法吗?

    谢谢

  • varunm1varunm1 主持人,职位:1207年独角兽
    @Flixport

    我不确定。@Telcontar120@mschmitz我可以提出建议

    谢谢
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    当然有很多方法可以从网页中获取数据到RapidMiner中,但这并不一定简单或直接,这取决于页面结构(这就是为什么有一个关于网页挖掘的整个专家培训课程!)。事实上,一些网络挖掘运营商已经有一段时间没有更新了,所以有一些“怪癖”你需要注意。但是如果你对这个话题感兴趣,你应该从市场上下载免费的网络挖掘扩展,看看Get Page操作符开始。这将允许您拉入任何html页面,然后您可以尝试使用其他一些文本挖掘操作符(从底层html)提取所需的信息。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    varunm1
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    是的,为了说清楚我们这里讨论的实际上是两个扩展Web挖掘扩展Web表提取扩展

    Web挖掘扩展是一个相当过时的建议@Telcontar120应该能帮到你。

    Web Table Extraction扩展是由位于多特蒙德的RapidMiner Research开发的;我的同事@ey写了扩展和an知识库文章大约一年前,这可能会有所帮助。

    斯科特
    Telcontar120
  • FlixportFlixport 成员职位:33因素二世
    2019年3月编辑
    嘿,所有的,

    谢谢你的回答。我认为你也可以将HTML文档转换为XML文档,或者这是不可能的?

    谢谢

登录注册置评。