相关矩阵

Sunnyboy_nhSunnyboy_nh 成员职位:10新手
2020年6月编辑 帮助
如何在具有不同值类型的属性之间使用相关矩阵运算符,特别是在标称属性和实数/整数属性之间?
标记:

最佳答案

答案

  • David_ADavid_A 管理员、版主、员工、RMResearcher、会员职位:295RM研究

    相关性矩阵运算符只能处理数值属性,这将需要秩相关性。
    但是运算符可以很好地处理任何数值,因此不需要在实数和整数之间进行转换。

    最好的
    大卫
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    计算标称属性和数值属性之间的相关性意味着什么?
    您应该首先将标称转换为数字,通常使用虚拟编码,然后计算结果数据的相关性。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • Sunnyboy_nhSunnyboy_nh 成员职位:10新手
    感谢Telcontar120的回复。
    是的,当然,我也做了一个转换到二项式首先,但这样做,我得到的结果矩阵的相关矩阵,而不是一个转换的属性,突然多个相同的属性,每次有稍微不同的值,我的矩阵行和列数,我不需要,我不明白.....!
    虚拟编码到底是什么意思?
  • Sunnyboy_nhSunnyboy_nh 成员职位:10新手
    嗨,大卫·A。

    是的,你是对的。我不想做两个整数和实数之间的关联而是做整数或实数和多标称数之间的关联?

  • Sunnyboy_nhSunnyboy_nh 成员职位:10新手
    感谢Telcontar120对虚拟编码的进一步解释.....因此,我在那里使用了另一个选项“唯一整数”,而不是虚拟编码,并以我想要的方式提示它,而不需要额外的相同属性的新值。
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    您应该非常小心地使用唯一的整数编码选项!如果您的底层标称属性不是标量和序数的,那么这种方法就没有多大意义。例如,假设您有一个标称属性,其值为(红、蓝、绿、紫)。唯一的整数编码将在内部将其转换为数字1=蓝色,2=绿色,3=紫色,4=红色。那么在任何类型的数值计算中使用这个整数(比如相关性)有意义吗?当然不!因此,虽然虚拟编码会创建额外的属性可能会让人感到恼火,但这确实是处理名义属性的正确方法,这些属性本身并不属于某种数字排序的类别。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    lionelderkrikor
登录注册置评。