看起来你是新来的。登录或注册开始。
Braulio写道: 交叉验证的文本分类是否适用于区分关于公司X的好消息和坏消息?
mierswa写道: 你可以尝试用相应的操作符对数据进行分段,看看这些分段是否得到不同的情感分类。
不幸的是,我不能去多特蒙德参加本周的研讨会。
mierswa写道: 文本插件包含一个名为“分段器”的操作符。
答案
我们想开始建立一个情绪预测系统。该系统应该能够预测市场对公司/产品的幽默。乐鱼官网手机版下载
我知道这是一项复杂的任务,我想得到一些关于使用Rapid Miner构建这样一个系统的提示。
(/报价)
好吧,用RapidMiner构建这样一个系统当然是可能的。事实上,RapidMiner是一个非常适合这些任务的工具,尽管它广泛覆盖了数据挖掘/ bi / etl方法,但它非常直观,因此可以很好地用于我们所说的快速原型这意味着可以在相对较短的时间内轻松地设置初始数据挖掘过程。由于RapidMiner也可以很容易地集成到您的应用程序中,因此您可以围绕刚刚设置的进程构建一个完整的系统。 是的,学习文本分类模型将是一种区分好消息和坏消息的方法。这当然意味着,你必须提供(或从互联网上抓取)文本段落,你可以呈现给学习者,使其能够学习一个模型。
进入第二部分,交叉验证构建了几乎所有监督学习任务的强制性部分,其中应该验证模型的性能。因此,如果您想知道您的模型如何区分好坏消息,那么在您的应用程序领域中,它也是适合和推荐的。
希望能有所帮助,
托拜厄斯
我只是想知道如何在实体层面上预测这种情绪。一件事是获得对文本的整体情感。另一件事(完全不同)是对不同的实体有不同的看法。在同一篇文章中,第一段可以是对X公司的正面评价,第二段可以是对Y公司的负面评价。
关于如何使用Rapid-i处理此类任务的任何提示都将非常感谢。
非常感谢
Braulio
你可以尝试用相应的操作符对数据进行分段,看看这些分段是否得到不同的情感分类。
欢呼,
Ingo
非常感谢。
不幸的是,我不能去多特蒙德参加本周的研讨会。
我正在建立一个团队,在巴西的这一领域工作(葡萄牙语),我当然需要一些合作伙伴,已经在建立这样的系统的专业知识。希望我们能保持联系。
十分感谢
Braulio麦地那
文本插件包含一个名为“分段器”的操作符。它有点难配置,但它应该能解决问题。否则,你可以自己抓取和/或分割数据,让RapidMiner做挖掘工作。 是的,很遗憾——但我相信我们以后可以联系。
欢呼,
Ingo
我将在文本分割器工作。
非常感谢