当考虑到EDA,更具体地说,教授真正深入数据的概念时,有时简单地将一些属性拖放到行/列周围并创建计数或汇总单个变量是非常好的。
计数/聚合可以像每个表1一样简单,但在理想状态下,我们可以包括行计数和每个单元格的另一个统计(行/列/总数%,或类似平均值的聚合)。
边距总计(行/列/总计)将有助于强化“我们在看什么”的元素,并帮助学生思考数据如何呈现不同的形状,尤其是在考虑汇总和总结时。
我知道我们可以使用各种操作符编写一些代码,但不可否认的是,当你正在探索和假设(例如Tableau风格的“表”探索)一个你从未见过的数据集时,只是拖放一些列是很好的。
0
答案
你看到“提取统计数据”了吗?不是拖放,而是给你一个概览。
最好的
马丁
德国多特蒙德
斯科特