使用自己的字典进行基于字典的情感分析

dancza · 2018年3月

嘿,伙计们,

我正在尝试使用自己的字典应用基于词典的情感分析。

首先，我的数据集是报纸采访的Excel文件，结构如下:第1列包含文本(文本在第1行的第一个问题中拆分，第2行中的第一个答案，第3行中的第二个问题等等)，第2列包含id(采访标识符，如果它是一个问题/答案以及哪一个)。我能够管理它从检索excel文件，处理文档，包括标记化。之后，我使用“基于字典的情感”和“应用基于字典的情感”操作符，但我不可能匹配字典(excel文件与第1列的单词和第2列的权重(1正和-1负))和报纸采访。

你能帮我吗?

<？xml version="1.0" encoding="UTF-8"?> <过程version = " 7.6.003”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文







<过程扩展= " true " >










<过程扩展= " true " >






<列出关键= "注释" >

< / >列表



<列出关键= " data_set_meta_data_information " >





< / >列表



< /操作符>






> < /过程
< /操作符>




< /操作符>













< /操作符>













<列出关键= " specify_weights " / >
<过程扩展= " true " >


< /操作符>





< /操作符>






> < /过程
< /操作符>



<列出关键= " set_additional_roles " >


< / >列表
< /操作符>


<列出关键= " specify_weights " >

< / >列表
< /操作符>






<列出关键= "注释" / >



<列出关键= " data_set_meta_data_information " >


< / >列表



< /操作符>





< /操作符>













步骤1<
> < /过程
< /操作符>
> < /过程

最好的问候,

丹尼尔

MartinLiebig · 2018年3月

嗨@dancza，

这是你用我的操作符!看到人们开始使用你写的东西总是很棒的。

请尝试附件的流程。如果你按照自己的方式去做，你就失去了“标记化”。您需要使用循环收集来保存它。

实际上我正在重新组织一些代码。在下一个版本中，我们将有一个名为“应用模型(文档)”的操作符，用于在文档集合上应用各种模型。然后检查标记化并抛出适当的错误消息。

最好的

马丁

<？xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文


<过程扩展= " true " >


<过程扩展= " true " >





<列出关键= "注释" >

< / >列表
<列出关键= " data_set_meta_data_information " >





< / >列表
< /操作符>






> < /过程
< /操作符>




< /操作符>



<列出关键= " specify_weights " / >
<过程扩展= " true " >








> < /过程
< /操作符>



<列出关键= " set_additional_roles " >


< / >列表
< /操作符>


<列出关键= " specify_weights " >

< / >列表
< /操作符>

<过程扩展= " true " >








> < /过程
< /操作符>



<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >


< / >列表
< /操作符>



< /操作符>












步骤1<
> < /过程
< /操作符>
> < /过程

dancza · 2018年3月

非常感谢!

busystudent · 1月23日

如何在rapidminer中查看此代码

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

使用自己的字典进行基于字典的情感分析

最佳答案

答案