JMySVMLearner和Platt Scaling与支持向量机的分割验证

scooter7scooter7 成员职位:8贡献我
2019年10月编辑 帮助
你好,

使用RM的模板之一(JMySVMLearner和Platt Scaling)和我的样本数据,我得到了8204/8646个正确的预测。XML是:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<过程version = " 5.3.015 " >
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文

将platt缩放作为SVM模型的后处理。
<过程扩展= " true " >


< /操作符>

<列出关键= " comparison_groups " / >
< /操作符>

<列出关键= "列" / >
< /操作符>



< /操作符>


<列出关键= " application_parameters " / >
< /操作符>











> < /过程
< /操作符>
> < /过程

然而,当我用相同的样本数据创建一个新的过程时,分割验证(70%的训练数据与分层抽样)和支持向量机的设置与JMySVMLearner在内核设置和其他值方面的设置相同,我的准确率只有57.21%。XML是:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<过程version = " 5.3.015 " >
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文

<过程扩展= " true " >


< /操作符>


<过程扩展= " true " >

<列出关键= " comparison_groups " / >
< /操作符>

<列出关键= "列" / >
< /操作符>


< /操作符>







> < /过程
<过程扩展= " true " >

<列出关键= " application_parameters " / >
< /操作符>










> < /过程
< /操作符>









> < /过程
< /操作符>
> < /过程

我不明白为什么准确度会有如此大的差异。

此外,我是否可以将普拉特缩放以某种方式应用于分割验证过程,因为我假设这会导致预测准确性的差异?

我对Platt缩放的想法很陌生,并且不完全理解这个模板的作用,因为我看不到训练/测试过程的分裂。

谢谢!
詹姆斯

答案

  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    你好,

    要添加Platt缩放(在当前版本的RapidMiner中称为Rescale confidence),只需将其添加到培训过程中,如下面的过程所示。然而,准确度的差异来自于您在第一个过程中将模型应用于训练数据的事实,这通常会大大高估您的模型。

    最好的问候,
    马吕斯
    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 6.0.003 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >



    < /操作符>

    评估决策树模型的交叉验证。
    <过程扩展= " true " >










    > < /过程
    <过程扩展= " true " >

    <列出关键= " application_parameters " / >
    < /操作符>










    > < /过程
    < /操作符>







    > < /过程
    < /操作符>
    > < /过程
登录注册置评。