Web挖掘,抓取Web抓取规则…请解释?
最佳答案
-
kayman 成员职位:662独角兽@Cash传统的组件在这里不起作用,因为这是一个动态页面,加载一个JSON文件,其中所有的位置都是分开的。
因此,您将抓取和存储的只是骨架,其中包含将在呈现期间注入数据的占位符。
所以这需要一些逆向工程,我会给你一些提示,但必须声明,这可能处于道德爬行的边缘。
如果你在firefox中加载页面,打开inspect元素窗口(windows上的快捷方式Q),然后选择网络选项卡,你可以看到这个页面的所有内容是从哪里得到的。这是从图像到脚本等,其中一个来源是一个相当大的json文件,从API调用,似乎有所有的位置。
所以纯粹从理论上讲,如果网站所有者对此没有问题,你可以直接下载这个json文件,并使用json到数据来处理它。6
答案
请看看这个链接
https://marketplace.www.turtlecreekpls.com/UpdateServer/faces/product_details.xhtml?productId=rmx_web
我希望这对你有帮助
mbs
我只是想记下他们的名字,地点和电话号码。我使用Selector Gadget来帮助我找出我需要的CSS标签,下面是它给我的:.places-app-location-citystatezip, a, .places-app-location-street, .places-app-location-name