看起来你是新来的。登录或注册开始。
我在rapidminer上使用了运算符“Correlation Matrix”,我相信它使用了Pearson Correlation,并且该运算符能够计算每个变量类型的相关性,包括二项(二分)和多项式。我想知道:操作符是如何计算相关性的,例如在一个二项式和一个数值属性之间?皮尔逊相关性不是只允许数值变量吗?它是简单地将二项式转换为0和1,还是做了其他事情?提前感谢,菲利浦- G.B.
嘿,
RapidMiner在内部为所有标称类型使用到整数的映射。这个映射用于关联。这在统计上不太好。所以如果你做了,我们就给你出个问题。
~马丁
谢谢你的回答
嗨,我是RapidMiner的新用户
实际上我有31个属性和10K个实例。我想用相关矩阵来表示属性之间的关系。问题是我有很多类型的数据,包括标称数据,多标称数据和数值数据,我可以知道很多类型的数据的相关矩阵的过程是什么吗?
正如之前在这篇文章中所解释的,典型的“相关分析”只适用于数值变量。你期望名义数据的相关系数告诉你什么?
如果希望使用具有相关性的标称数据,最好先将其重新编码为一系列二项式/虚拟变量。
答案
嘿,
RapidMiner在内部为所有标称类型使用到整数的映射。这个映射用于关联。这在统计上不太好。所以如果你做了,我们就给你出个问题。
~马丁
德国多特蒙德
谢谢你的回答
嗨,我是RapidMiner的新用户
实际上我有31个属性和10K个实例。我想用相关矩阵来表示属性之间的关系。问题是我有很多类型的数据,包括标称数据,多标称数据和数值数据,我可以知道很多类型的数据的相关矩阵的过程是什么吗?
正如之前在这篇文章中所解释的,典型的“相关分析”只适用于数值变量。你期望名义数据的相关系数告诉你什么?
如果希望使用具有相关性的标称数据,最好先将其重新编码为一系列二项式/虚拟变量。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询