为决策树模型生成层次结构?

eldenosoeldenoso 成员职位:65贡献我
2018年12月编辑 帮助

你好,

目前,我正在尝试用决策树来可视化大数据。由于我有一个具有层次结构的大型数据集,我想知道是否有可能将该层次结构应用于决策树。例如,我有2010-2015年不同年份的数据。由于逻辑上的原因,在决策树中首先有2015年,然后是2010年是不利的。但不幸的是,这正是模型所做的。是否有办法让树“知道”这些属性是按时间顺序排列的?

谢谢你!

菲利普:)

标记:

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    我将遍历year属性的值,并为每个值生成不同的树(从而从树中删除year属性本身)。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • eldenosoeldenoso 成员职位:65贡献我

    谢谢你,布莱恩!:)

    但是,一年的行动对以后几年的进一步行动不是很重要吗?所以通过每年生成一棵树,影响也被分割了,不再可见了?

    此外,我的树是如此之大,我可以把它打印在房子的墙上:smileyvery-happy:唯一的方法是通过增加树的最小增益来减小尺寸吗?

    问候
    菲利普

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家

    Moin菲利普,

    你的年份是数字年还是标称年?我认为它需要是数字来捕捉层次结构?

    最好的

    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • eldenosoeldenoso 成员职位:65贡献我

    嗨,马丁,

    谢谢你的回复!:)

    年份是数字类型yyyy,所以这应该是一个问题。我之前所做的是离散化和规范化所有属性,但IMO也不应该是问题吗?

    问候,

    菲利普

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家

    嘿,

    归一化对树没有影响。我不会离散年份。

    最好的

    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
登录注册置评。