语法错误:I am getting ?同时使用XPATH提取数据

沙赫扎德沙赫扎德 成员职位:4新手
2018年12月编辑 帮助
你好,我正试图从donedeal中提取一些数据。即网站。但是我得到了什么?而不是价值观。我不确定我的语法是否正确。

我已经使用谷歌chrome提取了XPATH。右键单击并检查元素并复制Xpath。例如,我提取了下面的Xpath
/ html /身体/主/ div / div [1] / div / div [2] / div [2] / div [3] / div [1] / div / div [1] / div / h1

我在div和html之前使用过h:但没有帮助

你能帮帮我吗?

问候
/沙赫扎德

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    @Shahzad你能把你的XML发给我吗?

    斯科特

  • 沙赫扎德沙赫扎德 成员职位:4新手
    2018年11月编辑
    你好,斯科特

    XML粘贴在下面。我有两个过程 广告的过程而且Donedeal过程.在广告过程中,我无法获取“年”休息所有其他属性都是OK。

    从Donedeal过程中,我无法从网页中获取任何属性。任何帮助都是有帮助的。

    问候
    /沙赫扎德
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    @Shahzad所以出于一些奇怪的原因,你的.txt文件中没有<>符号-因此不可能粘贴到RapidMiner。你可以使用¶将XML插入到这个线程中,然后选择“代码”吗?

    谢谢你!

    斯科特

  • 沙赫扎德沙赫扎德 成员职位:4新手
    你好,斯科特

    我已经尝试粘贴代码,但网页不允许我张贴评论。我已经附上文件,包括xml标签。希望这能有所帮助。

    问候
    /沙赫扎德
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理
    你好@Shahzad所以谢谢你。一些想法……

    -对于广告,如果你想要汽车的年份,为什么不只是创建一个新的属性,这是你的车辆名称或描述字段的前缀,其中有该信息?因为年份总是在开头和四位数字,你可以简单地这样做:



    -对于Donedeal,问题是您的信息是JSON格式,而不是XML格式。只需在提取信息操作符中使用Json路径选项,而不是XPath:



    如果您不熟悉JSONPath,这总是我的首选资源:https://goessner.net/articles/JsonPath/

    斯科特

  • kaymankayman 成员职位:662独角兽
    http://jsonpath.com/是一个易于使用的在线工具来测试您的json路径。
    结合Scott的链接,它已经为我节省了很多时间
    sgenzer
  • 沙赫扎德沙赫扎德 成员职位:4新手
    谢谢大家的最新消息。在少数情况下,年份不是车辆名称的一部分。因此JSON不能工作。我已经使用切割操作符从车辆名称中提取年份,但如前所述,如果车辆标题中没有提到年份,那么我就回到了原点:(

    我不确定是网站设计不好,还是GRID中的信息不能通过XPath访问。

    问候
    /沙赫扎德
登录注册置评。