奇怪啊(?)多项式回归结果
你好,
我正在尝试分析一个数据集,其中包含有关airbnb住宿的数据,以及哪些属性给这些住宿提供了高分(哪些属性最具影响力)。
我试着通过设置review_score_rating属性作为标签,然后运行多项式回归运算符,将其应用于模型并查看结果。
然而,预测值非常奇怪,通常标签的值在0到100之间,但预测值从+100000到-200000。
我对数据挖掘完全陌生,并不真正理解多项式回归算子是如何工作的。
下面是我的过程,我想知道我到底做错了什么,或者我应该怎么做?
此外,请找到附件的数据集我正在使用这个过程。
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.3.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
<列出关键= " filters_list " >
< / >列表
< /操作符>
<过程扩展= " true " >
<参数key="attributes" value="住宿|浴室|bed_type|卧室|床|cancellation_policy|cleaning_fee|host_has_profile_pic|host_identity_verified|host_response_rate|id|instant_bookable|number_of_reviews|property_type|review_scores_rating|room_type"/>
< /操作符>
<过程扩展= " true " >
< /操作符>
<参数键=“replace_what”值= "[{}“]" / >
< /操作符>
< /操作符>
<列出关键= " attribute_name " >
< / >列表
< /操作符>
<列出关键= " aggregation_attributes " >
< / >列表
< /操作符>
<列出关键= "列" / >
< /操作符>
< /操作符>
> < /过程处理设施属性<br/>
< /操作符>
<列出关键= " set_additional_roles " / >
< /操作符>
<列出关键= " key_attributes " >
< / >列表
< /操作符>
<列出关键= " comparison_groups " / >
< /操作符>
< /操作符>
> < /过程数据准备<br/>
< /操作符>
<枚举关键= "分区" >
< /枚举>
< /操作符>
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程
0
最佳答案
-
lionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽嗨@ogjtech,
首先祝贺您提供了流程和数据集,并严格地提出了您的问题。你很清楚这个社区的规则。
的确,你观察到的东西很奇怪。
如果您是数据挖掘的新手,我建议您将准备好的数据提交给autommodel。有了这个工具,RapidMiner将自动为你的回归问题创建相关的模型。
步骤如下:
重命名属性猫(s)和狗(s)通过猫和狗在你的Excel文件中。事实上,属性名中的括号"()"似乎会在autommodel中引发错误。
—在您的进程中,设置a断点后在Subprocess(“数据准备”)操作符上(右键单击此操作符)。
—执行流程
—在“Subprocess”和“。”结束后,进程停止结果面板显示准备好的数据集。然后点击汽车模型:
-然后点击"预测,然后选择你的目标属性/标签("review_scores_rating")
-然后点击几次下一个直到最后一个窗口。
您将看到所建议的模型的不同性能。
我个人试图将您准备好的数据提交给autommodel和广义线性模型,我得到了相关的预测(0到100之间):
希望这能帮到你,
问候,
莱昂内尔
3.
答案