相同类型的属性在统计视图中被分成两个块,为什么?

AtillaAtilla 成员职位:11学我
2022年5月编辑 帮助
在我给定的数据集(训练和测试)有一个属性称为部门。此功能包含2个类别缝纫完成-这两种显然是名义上的。在“统计”视图中快速挖掘属性的类别(缝纫,整理)部门是可视化的批量图表中类别在哪里完成显示了两次-在图中分为两个部分。我的问题是:在“统计”视图中,同一类别(完成)被分成两大块?
通常情况下,我希望看到2个批量(缝纫,整理),但在统计视图上有3个批量(缝纫,整理,整理)。回到“数据”视图,我只看到了功能系及其2类统计视图显示3个类别(见可视化),我不能理解为什么。也许我不理解可视化视图,甚至视图是不正确的,但数据集是正确的。所以最后我可能只需要选择正确的图表来得到一个准确的视图。

最好的答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:875独角兽
    解决方案接受
    嗨!

    你能发现问题吗?



    我在部门名称中添加了一些字符。部门名称后面有空格。使用Trim操作符来清理这些。

    问候,
    Balazs



    Atilla
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:875独角兽
    解决方案接受
    嗨!

    在这种情况下,我使用生成属性的公式如下:">" + attributename + "<"

    问候,
    Balazs
    Atilla

答案

  • AtillaAtilla 成员职位:11学我
    这太棒了。我只是有点不理解你是如何检测部门名称中的空格的(>结束<)?将尝试您关于修剪操作符的建议,以便对部门的变量(名称)进行修剪。谢谢你的帮助
登录注册置评。