将推文分类为3个不同的类别
我有60个推特数据集存储在不同的excel文件与字段(推文ID,推文文本,没有喜欢,没有。的份额,没有。的Retweet and tweet categories). I have manually trained the 10,000 tweets which is stored in excel file. I want to automatically classify the remaining tweets using RapidMiner but don't know how. I want all the attributes in my output file with category (sports, politics, war) of tweets. Pl explain which operators should be used to classify the text in to categories step by step. I am new to Rapidminer. I watched videos but I am not able to understand anything.
0
答案
如果可能的话,请告诉我一步一步进行此类分析所使用的操作符。我的作业要交了。
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
<列出关键= " sample_size_per_class " / >
<列出关键= " sample_ratio_per_class " / >
<列出关键= " sample_probability_per_class " / >
< /操作符>
<列出关键= " filters_list " >
< / >列表
< /操作符>
< /操作符>
<列出关键= " set_additional_roles " / >
< /操作符>
<列出关键= " specify_weights " >
< / >列表
<过程扩展= " true " >
< /操作符>
< /操作符>
< /操作符>
< /操作符>
> < /过程
< /操作符>
< /操作符>
< /操作符>
<过程扩展= " true " >
< /操作符>
> < /过程
<过程扩展= " true " >
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程
< /操作符>
> < /过程
你可以在这里找到这个数据集:https://github.com/quankiquanki/skytrax-reviews-dataset