汽车模型和医疗数据

DocMusherDocMusher 成员职位:333独角兽
2019年6月编辑 帮助

亲爱的RapidMiner朋友们:

祝贺你实现了autommodel工具,我认为这是在#noblackboxes社区中获得更多认可的关键一步。这是一个巨大的进步!试着理解医生是如何根据病人表现出的体征和症状做出决定的。除了他/她的临床观点(最好翻译为基于多年临床经验的优化模型)之外,医生还会查看患者的新数据,以便在某个时间点提供最佳护理。为了将人工智能或任何类型的高级分析集成到临床决策过程中,任何新的数据或模型都需要在这个智能过程中产生额外的知识或智慧。医学界并没有要求完全了解人工智能中使用的算法,但至少应该澄清由autommodel工具提供的发现。因此,我想在基于入住重症监护机构的患者的真实数据集上准备一些来自autommodel的结果的临床翻译。标签是ICU住院期间的生存或无生存。所有其他属性都与每个患者的合并症有关。我期待着你对结果的结论,在不久的将来安排一次Skype或RingCentral会议可能会更有趣。

谢谢

斯文

yyhuang Sergio_D_Mastro mdntth Tghadially

最佳答案

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    你好@SvenVanPoucke-这里关于医学背景下的“不要黑盒子”的伟大想法。我拿了你的csv文件,自己在autommodel中运行,只是为了看一些快速分析。最后你会看到我选择决策树作为我的模型有三个原因:1)你说理解模型和获得好的结果是很重要的;决策树允许这样做。2) DT的性能和其他模型一样好,3)运行时非常易于管理。

    您还将看到,最终的决策树可能不像预期的那样具有启发性,但至少对这个非医学人士来说,它似乎是有意义的。基本上所有的疾病因素都从模型中排除,以最大限度地提高性能;唯一保留的因素是年龄。如果你年轻,我们预测你活不下来,否则你还好。从数据科学的角度来看很简单,乐鱼平台进入但从人类的角度来看却很悲哀。

    我的视频分享可以找到在这里,生成的过程如下。


    斯科特

    < ?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    加载数据
    < /操作符>

    <过程扩展= " true " >


    <过程扩展= " true " >





    > < /过程
    <过程扩展= " true " >



    <列出关键= " set_additional_roles " / >
    定义预测模型的目标列。
    < /操作符>






    > < /过程
    应该定义一个目标列吗?> < /描述
    < /操作符>

    <过程扩展= " true " >





    > < /过程
    <过程扩展= " true " >





    通过分箱进行离散(每个分箱的范围相同)。
    < /操作符>






    > < /过程
    <过程扩展= " true " >





    按频率离散化(每箱相同计数)。
    < /操作符>






    > < /过程
    应该离散化数值目标列吗?> < /描述
    < /操作符>

    <过程扩展= " true " >





    > < /过程
    <过程扩展= " true " >




    <列出关键= " value_mappings " / >
    将标称目标值映射到新值
    < /操作符>






    > < /过程
    标称值应该映射吗?> < /描述
    < /操作符>


    <过程扩展= " true " >





    > < /过程
    <过程扩展= " true " >




    对于正类映射,确保目标是二进制。
    < /操作符>






    有可能定义哪一个应该是正面类
    < /操作符>







    > < /过程
    应该定义正面类吗?> < /描述
    < /操作符>


    <过程扩展= " true " >





    > < /过程
    <过程扩展= " true " >





    可能会移除列。
    < /操作符>






    > < /过程
    应该删除列吗?> < /描述
    < /操作符>

    <过程扩展= " true " >




    删除所有日期列。
    < /操作符>



    将所有标称列转换为文本,以便我们确保在下一次转换后所有列都具有polynominal type。
    < /操作符>



    将所有文本列转换为多标称列。
    < /操作符>





    将所有数值列(不是整数)变为实列
    < /操作符>









    > < /过程
    统一所有的值类型
    < /操作符>











    > < /过程
    所有一般的预处理步骤都发生在这个操作符内-双击它可以查看详细信息。
    < /操作符>

    <过程扩展= " true " >




    <列出关键= "列" / >

    将标称缺失替换为" missing "
    < /操作符>




    <列出关键= "列" / >
    用missing代替正无穷值
    < /操作符>




    <列出关键= "列" / >

    用missing代替负无穷大值
    < /操作符>



    <列出关键= "列" / >
    将缺失的数字替换为列的平均值。
    < /操作符>









    > < /过程
    替换缺失的值
    < /操作符>


    按字母顺序排列
    < /操作符>


    <列出关键= " filters_list " / >
    对标签值的情况进行建模,对缺少目标列的情况应用该模型。
    < /操作符>


    样本减少到250,000个,以防有更多。
    < /操作符>

    <枚举关键= "分区" >


    < /枚举>
    验证集的分割。
    < /操作符>

    为模拟器保留训练数据
    < /操作符>

    “参数”<列表键= >

    < / >列表

    <过程扩展= " true " >



    <过程扩展= " true " >



    < /操作符>





    > < /过程
    <过程扩展= " true " >

    <列出关键= " application_parameters " / >
    < /操作符>









    < /操作符>










    > < /过程
    交叉验证模型并在完整数据上构建最终模型。
    < /操作符>

    <列出关键= "日志" >


    < / >列表
    记录每个参数组合的所有性能。
    < /操作符>









    > < /过程
    寻找最优参数
    < /操作符>

    复制验证数据
    < /操作符>

    创建模型模拟器
    < /操作符>

    复制模型
    < /操作符>

    为没有值的情况创建预测,并为预测添加解释。
    < /操作符>


    提供所有记录性能
    < /操作符>


    创建电梯图表
    < /操作符>




































    结果:<br>10倍交叉验证的性能;最优parameters< br> 3。模型simulator< br> 4。Model< br> 5。带有解释的预测数据(仅当数据缺少标签时)<br>带有解释表的预测数据(仅当数据缺少标签时)< >提升chart< br> 8。所有演出> < /描述
    > < /过程
    < /操作符>
    > < /过程
    Sergio_D_Mastro
  • yasunotktyasunotkt 成员职位:7贡献我

    你好,同事

    AutoModel trial是一种快速、简便的机器学习模型构建方法。

    医疗数据集是一个新的例子,有5367名患者。

    应用案例如下:

    1.使用X-Means算法聚类

    2.使用主成分分析可视化四个集群

    3.基于决策树的疾病风险分类

    以下是PDF文件的结果。

    感谢您提供的学习特定领域数据集的机会。

    sgenzer yyhuang
登录注册置评。