“网络挖掘运营商”

17900713 r17900713 r 成员职位:9贡献我
2019年6月编辑 帮助

你好,

我是rapidminer的新手,我正试图在web挖掘运营商中使用cut文档。我想知道如何构建一个正则表达式,将一个选择在线评论。非常感谢你的帮助。我一直在尝试遵循教程rapidminer建议,但他们没有帮助太多。我在试着删掉亚马逊上的评论。

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    你好@17900713r欢迎来到这个社区。我不相信我们真的有一个关于如何创建RegEx表达式的资源,但是网上有很多其他的资源。我个人使用https://regexr.com/

    斯科特

  • 17900713 r17900713 r 成员职位:9贡献我

    感谢您的快速回复。我可以知道在哪里找到我的整个过程代码。我想把它粘贴在这里。

  • 17900713 r17900713 r 成员职位:9贡献我

    下面是我的XML处理过程。

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.003”>





    <过程扩展= " true " >

    https://www.rottentomatoes.com/m/the_dark_knight/reviews/?page=%{迭代}" / >
    <列出关键= " crawling_rules " / >











    <过程扩展= " true " >


    <列出关键= " string_machting_queries " / >

    <列出关键= " regular_expression_queries " / >
    <列出关键= " regular_region_queries " / >
    <列出关键= " xpath_queries " >
    @class ='表表拆开']/ h: tr " / >
    < / >列表
    <列出关键= "名称" / >


    <列出关键= " index_queries " / >
    <列出关键= " jsonpath_queries " / >
    <过程扩展= " true " >




    > < /过程
    < /操作符>


    <列出关键= " string_machting_queries " / >

    <列出关键= " regular_expression_queries " / >
    <列出关键= " regular_region_queries " / >
    <列出关键= " xpath_queries " >

    < / >列表
    <列出关键= "名称" / >


    <列出关键= " index_queries " / >
    <列出关键= " jsonpath_queries " / >
    < /操作符>






    > < /过程
    < /操作符>




    > < /过程
    < /操作符>
    > < /过程
    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.003”>




    < /操作符>
    > < /过程
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    你好@17900713r-所以在RapidMiner你的XML你的过程“代码”。

    斯科特

登录注册置评。