为回归模型提供偏差,以减少错误的总成本

HaukeVHaukeV 成员职位:5新手
你好,

我正在运行一个线性回归模型来预测货币总额。但是,如果我偏离目标超过15%,就会根据偏离目标的方向处以罚款。因此,如果我低估了15%或更多的价值,我必须支付500欧元的罚款,如果我高估了15%或更多的价值,我必须支付1000欧元的罚款。目前,我的模型正确预测了数据库的四分之三。
然而,这给我留下了巨大的成本,在预测过高和预测过低的情况下,成本是平均分布的。我想修改一下模型,把这个价格差异考虑进去,以减少遗漏的成本。这意味着我宁愿低于我的目标,而不是超过我的目标,因为那样更便宜。

目前,我生成了两个列,它们定义了我是否超出(true,False)或低于(true,False)目标15%或更多。我能帮上忙吗?我知道这可能会降低模型的准确性,但从业务角度来看,降低总成本非常重要。

亲切的问候,
Hauke

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3321年RM数据科学家
    @HaukeV
    您可能希望在分类模型中使用阈值?比如,如果信心(超调)只需要30%而不是50%就可以称之为超调?这将通过创建和应用阈值来完成。

    BR,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    lionelderkrikor
登录注册置评。