平均

sara20sara20 成员职位:110独角兽
2020年5月编辑 帮助
你好

对于一个数据集,我需要标签,所以我使用行的平均值,现在的问题是:为什么使用一个简单的标签的准确性非常低,为什么如果我使用平均值作为一个属性,然后根据我做的平均值“UP”和“DOWN”标签,准确率是95%?
你对此有什么看法?
平均值为数据带来相关性吗?(我认为数据的相关性不好)那么为什么结果不正常?
除了平均值,你对统计学有什么建议?

先谢谢你
莎拉

最佳答案

答案

  • sara20sara20 成员职位:110独角兽
    2020年6月编辑
    @Telcontar120

    谢谢你的回答。在这种情况下,如何为数据创建标签呢?(不要用“平均”,你建议用什么作为标签?)

    对不起,数据不是我的,我不能分享。

    问候
    莎拉
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    在不了解基础数据的情况下很难说。但一般来说,我不会通过组合来自多个示例的信息来创建标签——为什么不使用在未转换状态下平均的属性本身作为标签呢?
    如果希望预测分类问题而不是数值,还可以定义一个阈值,然后创建一个标称属性来指定属性是高于还是低于该阈值。例如,如果价值是销售额,那么您可以定义“高价值”交易的阈值,例如1000美元,然后根据该阈值将单个示例分类为高价值或不高价值。但是,您可能需要咨询领域专家的数据,以确定这样的阈值。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • sara20sara20 成员职位:110独角兽
    @Telcontar120

    我有一个标签,就像你提到的那样,它很有用,但与平均值非常相似,因为我取了一个平均值属性,或多或少就是我的标签。因此,仍然带来了数据的相关性,结果准确率在95%以上。

    无论如何,谢谢你的回答
    莎拉
登录注册置评。