“支持向量机”

tolau100tolau100 成员职位:4贡献我
2019年5月编辑 帮助
喂,

我只是用Rapidminer(之前使用Matlab)迈出了第一步,所以从编程命令行切换到使用GUI对我来说是相当困难的。不幸的是,我发现这里没有处理简单入门问题的有用教程或主题。

我想做的是:
我分析演讲数据中的魅力,并喜欢将我的样本分为魅力型/非魅力型演讲者。到目前为止,我已经为412个样本中的每个样本提取了168个特征,并且应该通过使用特征来自动进行或多或少的主观划分。
在Matlab中,支持向量机必须完成以下两个步骤:通过将样本分成2块(训练/测试数据集)来生成训练向量。训练数据集的第一列(0/1)决定样本是否具有魅力型。Matlab取第一部分样本来确定模型。之后,通过应用模型预测了另一半样本,我得到了每个样本的列向量(0/1),因此我可以与手动评估进行比较并创建拟合。

我在Rapidminer中所做的:
类似于Matlab,我导入了训练数据集(.xls),让rapidminer猜测特征(真实值,第一列我更改为“标签”和“标称”),并将数据拉入主进程窗口。之后,我采取了第一个SVM算子(建模->分类-> SVM)。我已经运行了该流程并获得了保存在存储库中的模型。之后,与Matlab中的第二步一样,我选择“建模->模型应用->应用模型”,并添加测试数据集以及存储的模型作为应用程序的输入。现在,不幸的是,我没有得到分类(0/1),而是每个样本的值在-0.87 < x < 2.541之间。

我需要什么帮助:
我假设在训练或测试数据集的声明中有什么是错误的,我没有得到。因此,我需要知道如何设置才能实现真正的两组分类。

希望这个问题是可以理解的,不要描述得太详细。感谢所有的评论。
标记:

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    欢迎来到RapidMiner。在进入细节之前,我建议您看一下任意可用的视频,介绍RapidMiner的gui方法。
    这里有几个链接:
    http://rapid-i.com/content/view/189/212/
    你也会在youtube上看到更多。

    此外,RapidMiner还提供了一些示例进程。它们位于示例存储库中。我建议看一下01_Learner和03_Validation示例。它们展示了如何在RapidMiner中进行建模和验证。

    通常,建议简单地将完整的数据集加载为一个Repository Entry,并使用X-Validation操作符自动将数据拆分为多个折叠。您可以使用分割验证操作符来避免交叉验证(我不建议这样做),并使用这种固定的分割方法。一般来说,这样做会容易得多……

    问候,
    塞巴斯蒂安。
  • tolau100tolau100 成员职位:4贡献我
    谢谢你的建议。他们真的帮助我弄清楚了RM是如何工作的,以及我可以自己在哪里寻找更多的信息。

    问候,
    tolau
登录注册置评。