Twitter数据挖掘-日期?缺失的推文?

ckm17dckm17d 成员职位:2学我
大家好!

我在2018年使用Rapid Miner进行了一个探索性项目,并能够及时捕获大约6个月的推文。我试图用它来挖掘不到一个月前的推文,然而,我只得到8天前的推文。例如,我只能得到4-12-20或更晚。

我还看到通过rapidminer搜索twitter的参数选项发生了一些变化。

有什么方法可以收集特定日期的推文吗?我已经尝试了参数上的“直到”选项,只得到一个空白的excel电子表格(我也做“写excel”操作)。

我知道上周我在4-12-20之前就有关于我的搜索的推特。

任何解决这个问题的帮助是感激的!


答案

  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    2019年,推特改变了其API访问规则,为了响应新的隐私法,我施加了新的限制。为了克服访问历史数据的限制,您需要付费订阅历史电源跟踪。然而,即使这样也会限制你在特定频率的时间范围内可以获得多少数据。
  • ckm17dckm17d 成员职位:2学我
    Jacobcybulski,

    谢谢你的意见,这很有道理。你知道1周是限制吗,还是有我应该知道的其他限制?


  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    我认为一周阅读历史动态的限制已经存在一段时间了。解决这个问题的一种方法是设置twitter收割机,并开始每天收集twitter,直到将来。我们在Python中做到了这一点,并在后台将进程作为服务保持活跃。通过这种方式,你可以收集你的每日免费tweet的限额(在特定的主题上),几周后你就会有合适数量的“历史”tweet。不要超过限制,因为你可能会被禁止滥用规则。当然,你可以订阅并访问更多的历史动态。你也可以求助于媒体分析公司,他们可以收取一定的费用。
登录注册置评。