网页抓取困难的网页(Airbnb)
你好,
我需要网页碎片Airbnb网页。我需要得到一个城市所有住宿的标点符号(“Veracidad”:5,“communication”:5,等等)。
首先,我想要得到一个城市所有住宿的网址例子。然后让网络爬虫对所有这些链接进行抓取,并获得单个标点符号。
但是当我在示例链接中使用最大抓取深度为1的url时,我没有得到住宿的url…
你能帮我一下吗?: womanhappy:
标记:
0
答案
你好@21763289请注意,抓取商业网站通常是非法的和/或违反了这些公司的服务条款。以下是airbnb网站上的具体用语:
(来源:https://www.airbnb.com/terms)
我强烈建议任何RapidMiner用户在使用我们的软件或任何其他网络抓取方式时,请检查任何网站的服务条款。
斯科特
好的,谢谢,我明白了。
所以,如果有人想私下回复我关于如何做假设…这只是为了给我的大学做一项研究。
嗨@21763289,
你检查过通过AirBnB API是否合法吗?看起来他们确实有一个:
https://www.airbnb.com/partner?c=tumblr&af=746240
我还没试过,但这可能是个好的开始。
愿一切都好!
罗德里戈。
好主意。谢谢! !