功能要求:可视化拖放简单汇总表

btibertbtibert 委员、大学教授职位:146大师
2019年9月编辑 帮助
当考虑到EDA,更具体地说,教授真正深入数据的概念时,有时简单地将一些属性拖放到行/列周围并创建计数或汇总单个变量是非常好的。

计数/聚合可以像每个表1一样简单,但在理想状态下,我们可以包括行计数和每个单元格的另一个统计(行/列/总数%,或类似平均值的聚合)。

边距总计(行/列/总计)将有助于强化“我们在看什么”的元素,并帮助学生思考数据如何呈现不同的形状,尤其是在考虑汇总和总结时。

我知道我们可以使用各种操作符编写一些代码,但不可否认的是,当你正在探索和假设(例如Tableau风格的“表”探索)一个你从未见过的数据集时,只是拖放一些列是很好的。

最佳答案

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    你好,
    你看到“提取统计数据”了吗?不是拖放,而是给你一个概览。
    最好的
    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    Tghadially
  • btibertbtibert 委员、大学教授职位:146大师
    谢谢,我还没用过那个扩展/操作符。也就是说,如果我使用内置的Deals数据集,我可能希望将Gender放在列中,将Future Customer放在行中,并将交叉点(交叉表)设置为平均年龄和/或行数。Extract Statistics是按列输出的,这很好,但我们也可以从典型的结果output > stats中获得。谢谢你的主意!
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    是的@mschmitz我正是这么想的。试试Turbo Prep吧。

    斯科特
  • btibertbtibert 委员、大学教授职位:146大师
    是的,这样就行了!谢谢
    sgenzer
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    如果其他人想快速查看Turbo Prep的Pivot,这里有一个视频链接:https://academy.www.turtlecreekpls.com/courses/turbo-prep-data-pivoting

    Tghadially sgenzer
登录注册置评。