我如何建立一个模型,为5个不同的目标和30个预测因子找到最好的预测因子?
最佳答案
-
varunm1 主持人,职位:1207年独角兽你好@Neuronerd
我想澄清一下,你有23个预测变量(特征/属性)和5个结果变量(每个结果变量对应不同的认知任务)。
现在,要了解哪一个预测变量更适合这些结果变量,有两种方法(基于我目前的想法)。一是找出变量或统计检验的全局重要性。在这种情况下,您可以使用相关性等统计测试来检查目标变量和预测变量之间的相关性。在rapidminer中,你可以使用“关联矩阵”并选择一个名为“包含特殊属性”的选项。您还可以使用“相关性权重”操作符,为高度相关的预测器/属性分配更高的权重。如果你想知道模型特定的权重/预测变量的相关性,你可以使用“加权支持向量机”或“加权随机森林”。这些是一些示例,您可以在建模->特征权重中看到更多操作符。
第二种方法叫做基于预测的局部权重/重要性。我们有一个称为“解释预测”的运算符,它为您提供每个预测样本的每个属性的重要性。该操作符中还有一个全局权重端口,可帮助您根据本地权重查看哪些属性具有最高的权重。
现在,如果你想建立一个模型并预测所有五个结果变量,有一个操作符叫做“多标签建模”。确保使用set role操作符为5个结果变量分配一些用户“用户定义的角色”。如果您不为这些变量分配角色,那么当为一个结果变量构建模型时,其他4个结果变量将包含在模型的输入(预测因子)中。
我希望这对你有帮助,如果你需要更具体的信息,请解释你的需求。2
答案
您可以构建一个多类分类模型。如果你不熟悉分类,我建议你看一下Rapidminer Academy的视频
下面的rapidminer youtube视频也会对你有所帮助。
https://www.youtube.com/watch?v=Gg01mmR3j-g&list=PLssWC2d9JhOZLbQNZ80uOxLypglgWqbJA
请让我们知道,如果你正在寻找任何具体的信息。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
对不起,你的问题不清楚
愿一切都好!
mbs
谢谢你!
当你说你有5个目标或认知任务时,你的意思是你有5个独立的结果变量或一个结果变量中的5个类别吗?
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离