支持向量机模型-两级以上的目标变量

HamsterDRHamsterDR 成员职位:3.贡献我
2019年6月编辑 帮助
我有一个数据挖掘问题,其中目标变量有四个层次。我在Statistica中使用了支持向量机模型,它对我的数据工作得非常好,并且支持四级目标变量。我刚刚开始使用Rapid Miner,看起来Rapid Miner中的所有SVM模型都只支持二进制目标变量。是这样吗?我认为libSVM实现支持两个以上的级别(这是Statistica使用的)——但是在Rapid Miner中对这个SVM实现的描述似乎仍然说它只支持二进制目标变量。如果这个功能现在还不可用,是否计划在将来使用?

大卫
标记:

答案

  • awchisholmawchisholm RapidMiner认证专家,会员职位:458独角兽
    你好

    它适用于具有多个标称值的标签。

    下面是一个使用Iris数据集的示例

    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.3.007 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >

    .
    < /操作符>

    <过程扩展= " true " >

    <列出关键= " class_weights " / >
    < /操作符>



    .
    .
    < /过程>
    <过程扩展= " true " >

    <列出关键= " application_parameters " / >
    < /操作符>



    .



    .
    .
    < /过程>
    < /操作符>


    .
    .
    < /过程>
    < /操作符>
    < /过程>


    问候

    安德鲁

  • HamsterDRHamsterDR 成员职位:3.贡献我
    我不这么认为——这是我试图运行一个具有四级目标变量的数据集时得到的结果。我使用了支持向量机libSVM选项。

    Apr 16, 2013 8:11:21 PM严重:处理失败:算子SVM对于给定的数据集没有足够的能力:不支持多项式属性

    大卫
  • awchisholmawchisholm RapidMiner认证专家,会员职位:458独角兽
    你可能在非目标变量中得到了名义项。输入示例集的元数据在SVM之前是什么样的?

    安德鲁
  • HamsterDRHamsterDR 成员职位:3.贡献我
    我在有16GB RAM的家用电脑上收到了这条消息(这个进程使用了12GB RAM)。在我的工作笔记本电脑(4GB)上,我甚至无法在不耗尽内存的情况下读取数据。在我看来,系统试图将所有东西都保存在内存中。这不是一个大数据集——9100个观测数据和423个变量——所以这是令人惊讶的。原始数据是在SAS中,但SAS导入步骤失败了(我已经报告了错误)-我必须将其保存为excel文件以获得Rapid-I来读取它。

    我想我讲得有点超前了——我刚接触Rapid-I,我需要从一些简单的例子开始。我刚刚得到了“面向大众的数据挖掘”(Matthew North)一书,并将通过书中的示例开始工作。

    大卫
  • awchisholmawchisholm RapidMiner认证专家,会员职位:458独角兽
    选择SVM进程,右键单击并选择断点前(shift F7)。

    运行该流程。

    进入元数据视图。

    每个属性的角色和类型是什么?

    一个应该有标签作用,并且应该是标称型。

    所有其余的常规属性必须是数字、整数或实数。

    如果验证成功,LibSVM将工作

    至于SAS导入问题,原始数据文件有多大?

    问候

    安德鲁
登录注册置评。