关于数据挖掘的问题
最佳答案
-
yyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:362RM数据科学家嗨@andre5007,
我的老师说,在他得到模型之前,他必须安排训练CSV的其他专长之间的关系,以便知道使用哪个模型。
我在这里的理解是尝试探索预测器/特征和你的标签之间的潜在关系/相关性(所谓的特征工程)。
https://academy.www.turtlecreekpls.com/learn/video/feature-engineering-intro
你有一些有用的操作符可供选择:
“生成属性”,例如专长1 *专长2,专长1 +专长4,专长1 /专长5
《汽车特征工程》,//www.turtlecreekpls.com/resource/automatic-feature-engineering/
通过“向前选择”或“向后消除”或类似的方法进行特征选择/减少
一个有用的文档可以在这里找到//www.turtlecreekpls.com/blog/data-prep-feature-generation-selection/
HTH !
YY1