我可以这么做吗?

豪尔赫豪尔赫 成员职位:19Maven
2018年11月编辑 帮助
你好,

我正在尝试做一个新的“项目”,但是我有一些问题,我不知道如何解决它们……

我有5个具有名义数据的属性(每个属性有4或5个可能的值),我的“乌托邦”是……
—为属性分配权重,并使用学习算子创建模型。这个模型将不得不预测3个不同的值(快,中,慢)训练后,如果我给属性的组合。

我试过使用朴素贝叶斯算法,但我无法分配权重。
我认为在树学习算子,但他们不使用所有的属性(只有1或2)…

欢迎你给我任何建议:-P

PD:对不起,我的英语不好。-(

谢谢,
豪尔赫

答案

  • 史蒂芬史蒂芬 成员职位:347Maven
    你好,乔治

    1 .分配权重是可能的,例如通过InteractiveAttributeWeighting。检查操作符树中的预处理->属性->权重。

    2.W-NaiveBayesUpdateable是Weka包的朴素贝叶斯算法,可以处理(据我所知)权重。

    问候,

    史蒂芬
  • 豪尔赫豪尔赫 成员职位:19Maven
    谢谢你的快速回复:)

    我尝试了W-NaiveBayesUpdateable,但是当我单击Validate时,该消息出现在控制台中

    G Feb 12, 2009 10:33:24 AM:[警告]W-NaiveBayesUpdateable: W-NaiveBayesUpdateable: Deprecated:请使用NaiveBayes代替。
    G Feb 12, 2009 10:33:24 AM:[警告]Deprecations: 1使用已弃用的操作符。

    能给我rapidminer未来版本的问题吗?天真贝叶斯是更好的算法吗?

    InteractiveAttributeWeighting是完美的!!谢谢,但是是否有任何预处理操作员允许我为这些值分配不同的权重?
    例如,快比中速好,中速比慢速好(或者我只能在训练阶段这样做吗?)

    下次谢谢你,你帮了我很多:)

    欢呼,
    豪尔赫
  • 史蒂芬史蒂芬 成员职位:347Maven
    你好,乔治

    @Naive贝叶斯
    我猜Rapid-I希望你使用他们的实现。但在我看来(完全主观)W-NaiveBayesUpdateabe更好。我不认为将来会有任何问题,因为weka操作符的集成在今天的数据挖掘工具中几乎是最先进的。

    @weighting
    Uuuh……对不起,我误会你了。你想要分配ExampleWeights即标签权重,而不是AttributeWeights。我不知道最好的方法是什么,但这里有一些建议:
    ->使用attributecconstruct创建一个权重属性。权重在w-naivebayesupdateable中使用,否则你可以使用像WeightedBootstrapping这样的东西来创建加权样本。注意,权重越高,模型对样本进行正确分类就越重要……所以……
    下面是一个示例过程(高尔夫)。Aml是使用rapidminer交付的数据集)




    < /操作符>

    <列出关键= " function_descriptions " >

    < / >列表
    < /操作符>



    < /操作符>
    < /操作符>
    注意,这可能会适得其反。在上面的例子中,总体auc低于没有加权的情况;)

    ->看看各种验证操作符,例如,costevaluator作为优化验证链的性能评估器。

    快乐的矿业

    史蒂芬

    PS:我现在要走了……
  • 豪尔赫豪尔赫 成员职位:19Maven
    在权重上你没有错。

    我想给这些属性赋一个权重举个例子。但是在第一篇文章中我忘了告诉你:P

    谢谢,你说的我都要试试。

    欢呼,
    豪尔赫
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    如果您希望为标签分配权重,以便根据预测错误的结果来惩罚预测错误,则可以使用MetaCost操作符。或者您可以简单地使用学习者的置信度来决定是否使用CostBasedThreasholdLearner切换到更“昂贵”的类会更好。

    如果树没有使用您的所有属性,则可能其他属性对于确定标签并不重要。这根本不是问题,而是防止模型过度拟合。

    问候,
    塞巴斯蒂安。
登录注册置评。