广义赫比算法(GHA)

s-a-s-hs-a-s-h 成员职位:4贡献我
2019年5月编辑 帮助
你好,

我的设置是exampleesetgenerator (ESG)和GHA。ESG生成的示例数=30,属性为500。只要我采用GHA的标准参数,一切都可以正常工作,唯一的问题是pc的文本输出,这需要相对较长的时间。我的第一个问题是,这个输出是否可以被禁用?

当我将GHA的number_of_component从-1更改为10时,错误消息“Process failed !”安装程序似乎不包含任何明显的错误,但您应该检查日志消息或激活设置对话框中的调试模式,以便获得有关此问题的更多信息。日志屏幕显示:“ArrayIndexOutOfBoundsException发生在GHA (GHA)的第一个应用程序”。

无论我更改了哪些设置,我总是得到相同的错误消息。你们有人有什么建议吗?

谢谢你!
Sascha
标记:

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    嗨Sascha,
    您可以使用PCA,如果您的RAM足够大,这将工作到6000个属性。
    当然,这只是一个暂时的解决方案,直到我们修复了错误。

    问候,
    塞巴斯蒂安。
  • s-a-s-hs-a-s-h 成员职位:4贡献我
    你好,塞巴斯蒂安,

    谢谢你的回答。

    你认为修复这个bug需要多长时间?

    你认为GHA对多少属性有效?-为了一个几乎无限的号码?在100,000个属性的限制下,只计算前100个pc会起作用吗?

    你认为在一台标准的2 GHz双处理器机器上进行这些计算需要多长时间?-我知道你不能给我一个确切的答案,但是你能估计一下这需要喝杯咖啡休息的时间,还是一顿丰盛的午餐的时间,还是整个下午的时间,或者超过一天的时间?-我认为期望的精度也会发挥很大的作用。

    我问这个问题的原因是,GHA是一个有趣的特性,它将对我想使用它的应用程序有很大帮助。唯一的问题是,它是否会在给定问题的合理时间内交付结果。你觉得呢?

    谢谢你的回答。

    Sascha
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,萨沙,
    我不知道这要花多长时间。我们现在有很多事情要做,我有点不好意思说,但付费客户坚持要我们优先考虑。
    由于编写GHA程序的开发人员早就离开了我们的项目,而我从未使用过它,所以我不能说它需要多长时间。标准PCA需要大约3个小时来计算4000个属性,然后计算所有pc。
    如果您正在处理基因表达数据,那么您可能有比示例更多的属性。然后您可以尝试KernelPCA,它不仅使您能够分析更高维度的方差,而且在属性数量上只有线性运行时间,但在示例数量上是二次的。

    问候,
    塞巴斯蒂安。
  • 旧的用户旧的用户 成员职位:0新手
    你好,塞巴斯蒂安,

    谢谢你的有用的答案-我已经尝试了kernelPCA -因为它似乎对我来说足够快-对我来说唯一剩下的问题是:核PCA是否也在完整的特征向量和特征值的意义上提供结果?

    下面的代码传递PCA的pc和特征值:






    < /操作符>

    < /操作符>


    < /操作符>

    < /操作符>
    < /操作符>

    这段代码没有提供任何有用的信息:






    < /操作符>

    < /操作符>


    < /操作符>

    < /操作符>
    < /操作符>

    唯一的输出是:
    “KernelPCA
    (电子邮件保护)8 b622”

    他们有机会得到实际计算出来的信息吗?

    谢谢你的回答,

    Sascha
登录注册置评。