如何对其进行过采样

nathaliejoynathaliejoy 成员职位:7因素二世
我想把过采样应用到我的Rapidminer数据分析中。我认为我的类别是不平衡的,以nat - grade - comments为类别,我有VLM, MTM, LM和AM作为我的类别的值,即nat - grade - comments。现在我尝试使用样本操作符,但没有发生任何事情,它一直给我错误。

它总是告诉我,我有一个标签,我相信我只有不平衡数据,我有超过700行,这并不意味着我有非常少的数据。请帮我一下,下面是我的XML

我不能粘贴我的xml,但这里是捕获的过程:


答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    如果数据不平衡,可以尝试加权或抽样。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • tftemmetftemme 管理员、员工、RapidMiner认证分析师、RapidMiner认证专家、RMResearcher、会员职位:164RM研究
    @nathaliejoy

    您还可以在Sample (Stratified)操作符之前插入一个断点,以调查直接进入操作符的数据(通过右键单击操作符并选择相应的选项插入断点)。

    当错误消息显示它只有一个标签时,似乎标签属性(我假设在您的示例中是Nat-Grade-Resume属性)只有一个值。也许在预处理之前,它被意外地减少到只有一个值或类似的东西。

    如果不查看进入Sample操作符的数据,我们现在只能进行猜测。

    希望能有所帮助
    最好的问候,
    Fabain

登录注册置评。