使用自己的字典进行基于字典的情感分析
嘿,伙计们,
我正在尝试使用自己的字典应用基于词典的情感分析。
首先,我的数据集是报纸采访的Excel文件,结构如下:第1列包含文本(文本在第1行的第一个问题中拆分,第2行中的第一个答案,第3行中的第二个问题等等),第2列包含id(采访标识符,如果它是一个问题/答案以及哪一个)。我能够管理它从检索excel文件,处理文档,包括标记化。之后,我使用“基于字典的情感”和“应用基于字典的情感”操作符,但我不可能匹配字典(excel文件与第1列的单词和第2列的权重(1正和-1负))和报纸采访。
你能帮我吗?
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.6.003”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<过程扩展= " true " >
<列出关键= "注释" >
< / >列表
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
> < /过程
< /操作符>
< /操作符>
< /操作符>
<列出关键= " specify_weights " / >
<过程扩展= " true " >
< /操作符>
< /操作符>
> < /过程
< /操作符>
<列出关键= " set_additional_roles " >
< / >列表
< /操作符>
<列出关键= " specify_weights " >
< / >列表
< /操作符>
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
< /操作符>步骤1<
> < /过程
< /操作符>
> < /过程
最好的问候,
丹尼尔
0
最佳答案
-
MartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
嗨@dancza,
这是你用我的操作符!看到人们开始使用你写的东西总是很棒的。
请尝试附件的流程。如果你按照自己的方式去做,你就失去了“标记化”。您需要使用循环收集来保存它。
实际上我正在重新组织一些代码。在下一个版本中,我们将有一个名为“应用模型(文档)”的操作符,用于在文档集合上应用各种模型。然后检查标记化并抛出适当的错误消息。
最好的
马丁
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<过程扩展= " true " >
<列出关键= "注释" >
< / >列表
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
> < /过程
< /操作符>
< /操作符>
<列出关键= " specify_weights " / >
<过程扩展= " true " >
> < /过程
< /操作符>
<列出关键= " set_additional_roles " >
< / >列表
< /操作符>
<列出关键= " specify_weights " >
< / >列表
< /操作符>
<过程扩展= " true " >
> < /过程
< /操作符>
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
< /操作符>步骤1<
> < /过程
< /操作符>
> < /过程- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德2
答案
非常感谢!