Twitter分析/数据集比较
嗨
这令人讨厌的部分是我在做利物浦大学的一个模块时使用了快速矿工,从那以后就再也没有碰过,现在我已经忘记了如何做任何事情,它不像骑自行车!
有人能给我一些指导/复习来实现以下目标吗?
我把一个推特连接器,我很高兴在我的关键字推文拉
我有一个excel,我添加了一个数据集,其中包含一个列与“推特”和另一个列与0或1
我需要做的是分析进入连接器的推文,并与之前在我的数据集中有1的推文进行比较得分
下一步将是使用一个zap,我很高兴(有点)去添加一行到谷歌表,理想情况下,我宁愿不使用zap,虽然一些如何使用快速矿工添加一个新的行到谷歌表或表在框中,包含了原始推文的所有数据和我的评分值
然后将整个过程自动化,每5分钟运行一次
提前感谢
克里斯
标记:
0
答案
如果我理解正确的话,Zap包含您的历史数据,您希望使用这些数据对传入的tweet进行评分。
如果是这种情况,你真的不需要Zap,只要把它导出到Excel表格,然后用它作为你的训练数据。然后建立一个模型,评分,并附加到历史数据集。
简单来说就是这样,就像附上的截图一样。
要使它每5分钟运行一次,请安装RapidMiner服务器并从那里运行它。
非常感谢您的回复
是的,你是正确的,我的训练数据,如果你可以来自excel,所有我需要zap做的就是在它被分析后写下得分的推文
我也似乎错过了一个技巧,我不知道如何自动化一个过程,所以它只是每5分钟运行一次或任何其他时间表
克里斯
这部分我不明白,“我需要zap做的就是在分析完比分后写出这条推文。”
你的Zap是否在RapidMiner之外的其他地方写了三个结果?您可以使用Zapier连接器来做到这一点。
如果没有,我就把这个过程和所有的预测写回Excel。只需在追加操作符的末尾附加一个Write Excel。