奇怪啊(?)多项式回归结果

ogjtechogjtech 成员职位:5因素二世
你好,

我正在尝试分析一个数据集,其中包含有关airbnb住宿的数据,以及哪些属性给这些住宿提供了高分(哪些属性最具影响力)。
我试着通过设置review_score_rating属性作为标签,然后运行多项式回归运算符,将其应用于模型并查看结果。
然而,预测值非常奇怪,通常标签的值在0到100之间,但预测值从+100000到-200000。
我对数据挖掘完全陌生,并不真正理解多项式回归算子是如何工作的。

下面是我的过程,我想知道我到底做错了什么,或者我应该怎么做?
此外,请找到附件的数据集我正在使用这个过程。
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.3.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文







<过程扩展= " true " >


< /操作符>




<列出关键= " filters_list " >






















< / >列表


< /操作符>

<过程扩展= " true " >



<参数key="attributes" value="住宿|浴室|bed_type|卧室|床|cancellation_policy|cleaning_fee|host_has_profile_pic|host_identity_verified|host_response_rate|id|instant_bookable|number_of_reviews|property_type|review_scores_rating|room_type"/>









< /操作符>

<过程扩展= " true " >













< /操作符>













<参数键=“replace_what”值= "[{}“]" / >

< /操作符>















< /操作符>

<列出关键= " attribute_name " >

< / >列表



< /操作符>



<列出关键= " aggregation_attributes " >

< / >列表


< /操作符>
















<列出关键= "列" / >
< /操作符>














< /操作符>












> < /过程
处理设施属性<br/>
< /操作符>



<列出关键= " set_additional_roles " / >
< /操作符>




<列出关键= " key_attributes " >

< / >列表

< /操作符>

















<列出关键= " comparison_groups " / >


< /操作符>













< /操作符>












> < /过程
数据准备<br/>
< /操作符>

<枚举关键= "分区" >


< /枚举>



< /操作符>








< /操作符>

<列出关键= " application_parameters " / >

< /操作符>

















< /操作符>















> < /过程
< /操作符>
> < /过程


airbnb.xlsx 14.3米

最佳答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    解决方案接受
    @ogjtech

    首先祝贺您提供了流程和数据集,并严格地提出了您的问题。你很清楚这个社区的规则。

    的确,你观察到的东西很奇怪。
    如果您是数据挖掘的新手,我建议您将准备好的数据提交给autommodel。有了这个工具,RapidMiner将自动为你的回归问题创建相关的模型。

    步骤如下:

    重命名属性猫(s)狗(s)通过在你的Excel文件中。事实上,属性名中的括号"()"似乎会在autommodel中引发错误。
    —在您的进程中,设置a断点后在Subprocess(“数据准备”)操作符上(右键单击此操作符)。
    —执行流程
    —在“Subprocess”和“。”结束后,进程停止结果面板显示准备好的数据集。然后点击汽车模型



    -然后点击"预测,然后选择你的目标属性/标签("review_scores_rating")
    -然后点击几次下一个直到最后一个窗口。

    您将看到所建议的模型的不同性能。

    我个人试图将您准备好的数据提交给autommodel和广义线性模型,我得到了相关的预测(0到100之间):


    希望这能帮到你,

    问候,

    莱昂内尔



    varunm1 Tghadially ogjtech

答案

  • ogjtechogjtech 成员职位:5因素二世
    你好,

    感谢您的快速回复,很抱歉批准晚了。
    这确实给了我想要的结果,真的帮助我继续我的研究!

    再次感谢您的帮助!

    问候,

    珀斯
    lionelderkrikor Tghadially
登录注册置评。