二元分类-线性回归

裹尸布裹尸布 成员职位:2新手
2020年5月编辑 帮助
我用的是UCI的蘑菇数据。它有两个类p和e。
它是一个二进制分类问题,所有的数据都是文本形式的。我的数据有一个叫做“类”的栏目。我把它设为一个标签。然后我对所有列执行“标称到数字”操作,因为所有数据都是文本。我使用线性回归作为模型,并在最后添加了“性能”。它给了我一个错误“标签属性(类)必须是数值计算的性能为回归任务”。

我发现的唯一解决方案是首先将“标称到数字”将类分为两个(class = e, class = p),但我注意到我只能将class = e作为标签或class = p标签,即使我为类e和p放置两个单独的“SetRoles”块。
如何为回归设置两个标签?
此外,根表示平方误差为零,平方相关为1。我认为我的结果不正确。

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年5月编辑
    你好@shroud

    抱歉,我对这个问题有点困惑。如果你在一个属性中有两个类,如果你试图对它进行分类,那么这是一个分类问题,而不是回归问题。所以,原始形式的线性回归是行不通的。您需要使用“广义线性模型”算子进行分类任务。

    为了检查你的标签是“二名”、“多名”还是“数字”,你只需要在标称上设置一个断点为数字,右键单击操作符并选择“断点后”。运行该进程,然后可以看到数据,并转到可以看到类型的统计信息。

    如果您的标签是数值,那么您需要使用独立的“性能操作符”或“性能(回归)”操作符。

    请告诉我们这是不是你要找的东西?如果你想让我们检查,请提供给我们从快速矿工工作室导出的过程。为此,您需要进入FILE——> Export Process,然后保存.rmp文件并附加到该线程中。同时附上您的数据集,以便我们重新生成此错误。

    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    lionelderkrikor sgenzer
登录注册置评。