操作员“获取页面”没有在AI Hub上运行

methusimethusi 成员职位:5学我
2021年12月编辑 帮助


我有一个进程在AI枢纽上运行,我有操作员“获取页面”(ext. Web Mining)嵌入。
当我在RM Studio中运行这个过程时,一切都很好。
当我在AI Hub上运行过程,但从RM Studio (在AI Hub上运行Process’),一切都很好。

但当我启动自己创建的网络服务时,“Get-Pages”操作器似乎制造了麻烦。其他网络服务正在运行。当我禁用“获取页面”时,web服务也在运行。所以我坚信这与AI Hub上的流程运行方式有关。

这是我在运行web服务时得到的错误消息:
de.rapidanalytics.ejb.service.ServiceDataSourceException 为test_pages服务执行/home/bot/test_pages进程错误:com.rapidminer.operator.web.io.MultiThreadedCookieManager不能转换为com.rapidminer.operator.web.io.MultiThreadedCookieManager

有趣的是,我发现,如果我在AI Hub上运行存储库之外的流程,它会成功运行。但是如果我测试网络服务,它就不能工作。

这是我用于测试的过程。当我禁用操作符“获取页面”一切工作正常。
<?xml version="1.0" encoding="UTF-8"?>      <参数key="logverbosity" value="init"/> <参数key="random_seed" value="2001"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="30"/> <参数key="encoding" value="SYSTEM"/>   <参数key="repository_entry" value="/home/user/some_table_with_urls"/>   <参数key="link_attribute" value="links"/> <参数key="random_user_agent"value="true"/> <参数key="connection_timeout" value="10000"/> <参数key="read_timeout" value="10000"/> <参数key="follow_redirects" value="true"/> <参数key="accept_cookies" value="原服务器"/> <参数key="cookie_scope" value="global"/> <参数key="request_method" value="GET"/> <参数key="delay" value="none"/> <参数key="delay_amount" value="1000"/> <参数key="max_delay_amount" value="500"/>       



我不知道该怎么做。

谢谢你的帮助!

最好的
马修斯

最佳答案

  • methusimethusi 成员职位:5学我
    解决方案接受
    对于那些想知道的人,我可以通过走另一条路来解决我的问题。我没有调用web服务,而是使用schedule API来调度流程:
    职位服务器 /执行/时间表使用相应的标题和正文

    在body中,我没有设置执行时间和force=true -这立即开始执行。

答案

  • JEdwardJEdward RapidMiner认证分析师,RapidMiner认证专家,会员职位:578独角兽
    我怀疑问题可能是您在AI-Hub JobAgent上安装了包含“Get Pages”的扩展,但没有安装在服务器本身上。

    如果我没有记错架构图,当您从Studio调度作业或在服务器上运行作业时,它将在JobAgent上执行。
    然而,如果它作为web服务运行,那么它就不会运行在JobAgent上,而是运行在服务器本身上。

    检查

    [docker volumes path]/prod_rm-server-home-vol/_data/乐鱼体育安装resources/extensions,看看你能不能找到它。你可以对比一下

    [docker volumes path]/prod_rm-server-ja-extensions查看是否匹配。


登录注册置评。