需要建立一个经济可行性的模型。不确定如何继续进行变量选择

RustyboltcutterRustyboltcutter 成员职位:2新手
嘿,伙计们,
所以我试着用下面的变量来建立一个预测房地产经济可行性的模型。


因此,我使用已列出的数据创建了listd_year。基本上,在2018年底之前上市的任何房产都是旧房产,之后的任何房产都是新房产。
所以我用来使经济可行性变量的逻辑是这个规则,

如果(listd_year == "New" && overall_satisfaction>3,"经济可行",如果(listd_year == "Old" && overall_satisfaction>3,"经济可行","不经济可行"))

但当我运行这个模式时,我得到100%的准确率Kappa为1,这显然意味着它过拟合,根本不起作用。
我真的很希望能得到一些关于如何继续前进以及如何让它实际工作的建议。


标记:

答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @Rustyboltcutter

    实际上,可能存在过拟合现象,或者您的某个属性与您的标签属性完全相关。

    RapidMiner可以自动执行相关的特征选择(并最终生成特征)。请使用
    接线员打来电话自动特征工程

    我可以给你的另一个建议是,把你的数据集提交给AutoModelRapidMiner。在这种情况下,它是“包罗万象”:
    Rapidminer负责一切:RM首先根据每个特征的“质量”执行“初步”特征选择
    特征,然后RM将执行特征选择(并最终基于您的设置生成特征),建模和模型性能的估计。在计算结束时,RapidMiner显示所有结果(每个模型的性能)。

    如果您还有其他问题,请告诉我。

    希望这能帮到你,

    问候,

    莱昂内尔

登录注册置评。