忽略深度学习错误!

SabaRGSabaRG 成员职位:13因素二世
编辑5月31日 帮助
不幸的是,深度学习模块不能发送它的异常温和,它失败的整个过程,所以,我不能使用它在优化操作,如网格搜索,因为整个过程将失败的配置错误!

此外,它的错误不清楚,我不知道我应该如何解决问题,通常没有文档或类似的情况,因为深度学习层的架构和配置多种多样。


答案

  • David_ADavid_A 管理员,版主,员工,rmresearch人员,成员职位:286RM研究
    亲爱的@SabaRG

    感谢您指出这一点,我们将在未来尝试改进错误处理,并在可能的情况下给出更好的解释。
    你能解释一下你在那里试图优化什么吗?为了找到实际的问题,如果您能分享完整的过程或屏幕截图中显示的完整错误消息,那就太好了。

    最好的
    大卫
  • SabaRGSabaRG 成员职位:13因素二世
    亲爱的@David_A
    非常感谢您的关注。

    我写了一次答案,但我的浏览器关闭了(因为在运行Rapidminer时内存很低微笑:),所以,我再解释一遍中性:

    我通常使用网格优化(GO)并在其中放入一个交叉验证操作符(CVO)。然后我将在CVO中放入一个像决策树(DT)或深度学习(DL)这样的机器学习算法。然后配置GO来寻找最佳的超参数,特别是对于逻辑参数和多项式参数,如决策树算法中的准则参数。

    当我为DL执行上述任务时,我知道有些值(选项)是无效的,比如DT的标准的最小二乘,但我配置GO忽略这些错误,它不会在整个过程中失败,但在DL中,配置错误会导致失败,它不会抛出错误。GO不能忽略DL错误,我认为这是因为DL中糟糕的编码和处理错误。例如,操作符工具箱扩展中的Try操作符也不能处理DL错误。

    如果你想知道为什么我有错配置,那是另一个故事,如果有人能解决这个问题,那就很好了:
    我正在为时间序列建模一个多类分类问题。我对DL+张量流有两个问题:

    1) DL+Tensorflow不能在多标签操作符(MLO)内部使用,因为MLO不能接受Tensorflow数据作为输入,如果我将我的Tensorflow转换为一个示例集,并使DL模型在MLO内部,输出模型与MLO有不同的I/O, MLO不能接受输出模型!因此,我必须自己使用loop属性实现多标签操作符。请考虑为MLO解决这个问题(把它当作我的第二个bug #bug_report)。

    2)当我配置DL做二进制分类时,似乎Tensorflow或DL将我的输入标签(真/假)转换为数字(0/1),DL想使用回归而不是分类!因此,由于没有针对这些特殊情况的特定文档和教程,我更希望能够配置GO来找到可以运行的最佳配置,并在下一步中找到具有更高性能的最佳参数。但是,正如我前面所说,DL在错误配置场景中不会抛出异常,从而导致整个流程失败。我需要看到Tensorflow数据(至少是它的一部分),但没有这些操作符的可视化(考虑这是我的第三个错误#bug_report)。

    我还附上了我的过程,其中所有的过程都有一个训练和测试数据集,就像DL的教程示例集(在//Samples/Deep Learning/data/ICU Subsample training),但我的数据集有一个多二进制标签:
    1- OptimizeModels-MultiLabel:使用有第二个错误的GO和MLO

    2- MultiLable-Manual:没有bug,它为我工作,但我需要优化它,它有一个逻辑问题,它将我的二进制标签转换为一个数字标签,我必须转换最终的预测到一个二进制标签使用数字二项式运算符。我不明白为什么哪个操作符将我的标签转换为数值,如果我从Tensorflow有一个可视化输出,我不明白问题是来自“Timeseries to Tensorflow”操作符还是DL操作符?(第三个错误)

    3- OptimizeModels-MultiLabel-Manual:它包含GO +我的多标签处理的手动实现,当我配置以各种参数运行进程时失败(第一个错误)。

    我真的很想在bug分类上帮助你,但我不知道如何在代码中找到这些问题(哪里有相关的代码),而且我不熟悉你的架构、数据模型和逻辑。此外,这些问题中的许多都是在扩展中。但是,我会尝试阅读Github上的RapidMiner源代码库,并尝试在未来帮助你。微笑:

    真诚
  • David_ADavid_A 管理员,版主,员工,rmresearch人员,成员职位:286RM研究
    亲爱的@SabaRG

    非常感谢非常详细的反馈。这样的描述对我们今后的改进非常有价值。

    我同意DL扩展的错误处理可以更好,我们将尝试捕获更多的错误,特别是糟糕的配置。

    不幸的是,张量对象和常规的RapidMiner示例集并不是完全兼容的,因此很难确保所有的操作符都能与两者兼容。对于有张量的多元时间序列,我们也计划改进我们的选择,所以这应该不是一个问题。

    最好的问候,
    大卫
登录注册置评。