未在RM服务器上运行的进程被卡住

DrhelpDrhelp 成员职位:17因素二世
2019年11月编辑 帮助
进程没有在Rapidminer服务器上启动-没有从“pending”状态移动。下面是服务器日志中的前几行(最近的)。我不知道问题的本质是什么,虽然这似乎与时间有关。我该如何解决这个问题?

[00:07:28 . 583] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28. 923] INFO[stdout] (taskScheduler-1) [2m2019-11-25 00:07:28.869] 0;39m [32m] INFO[0;39m [35m9761] 0;39m [2m-][0;39m [2m][taskScheduler-1][0;39m [36mc.r.e.jobservice.scheduled.]标记作业代理' Agent - bindings ' (5fad92a9-1069-4070-b7f7-23708ce457d4)为'TIMED_OUT',因为它自'2019-11-24 23:35:21.71'以来一直没有响应。
[00:07:28 . 584] [org.jboss.as]JBAS014143:定时器[rapidminer-server-ear.rapidminer-server-ejb]的先前执行。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:29 . 169] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:29 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:定时器[rapidminer-server-ear.rapidminer-server-ejb]的先前执行。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as](EJB默认- 7)JBAS014143:定时器[rapidminer-server-ear.rapidminer-server-ejb]的先前执行。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:29 . 204] [org.jboss.as]JBAS014143:定时器[rapidminer-server-ear.rapidminer-server-ejb]的先前执行。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:29 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as]JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as](EJB默认值- 38)JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
[00:07:28 . 585] [org.jboss.as](EJB默认值- 1)JBAS014143:先前执行的定时器[rapidminer-server-ear.rapidminer-server-ejb]。PassiveTriggerExecutorEJBImpl df6da5c -247a-465d-9508-63c838ad80a6]仍在进行中,跳过这个重叠的计划执行:星期一11月25日00:07:28 GMT 2019定时器状态为IN_TIMEOUT
标记:

最好的答案

答案

  • Pavithra_RaoPavithra_Rao 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,会员职位:123RM数据科学家
    @Drhelp

    这里的服务器版本是什么?另外,您能否详细说明您在服务器上配置了多少作业代理,哪些作业代理处于挂起状态?
  • DrhelpDrhelp 成员职位:17因素二世
    Pavithra_Rao

    抱歉,我一开始没有把这些信息包括在内。我使用RM服务器9.5.1和目前1个工作代理(见附件)。谢谢你!
  • Pavithra_RaoPavithra_Rao 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,会员职位:123RM数据科学家
    @Drhelp

    谢谢你在这里提供更多的细节。你能把server.log文件也分享一下吗?
    这个服务器安装在Windows或Linux机器上吗?

    此外,我建议您在support.www.turtlecreekpls.com(如果您可以访问它)上提出支持票,以获得更快的响应和解决方案。

    欢呼,
    Pavithra
  • DrhelpDrhelp 成员职位:17因素二世
    Pavithra_Rao。谢谢你的回复。附带server.log文件。我想我没办法筹到支持票。
    server.log 3.2米
  • Pavithra_RaoPavithra_Rao 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,会员职位:123RM数据科学家
    @Drhelp

    查看server.log,它没有显示太多关于Job-agent TIME_OUT状态的信息。

    您还可以共享agent.log文件吗?

    它将位于\job-agent-home\log\agent.log中

    在发送agent.log之后,将建议停止并启动RapidMiner服务器(如果可能的话)

    我猜你已经在windows上安装了服务器,windows服务可以很容易地重新启动服务器。

    欢呼,
    Pavithra
    sgenzer
  • DrhelpDrhelp 成员职位:17因素二世
    Pavithra_Rao。附件是agent.log文件的副本(.txt格式)。

    我将按照建议停止并启动RapidMiner服务器。我在mac上安装的,不是windows。谢谢你!
  • Pavithra_RaoPavithra_Rao 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,会员职位:123RM数据科学家
    谢谢,请随时告诉我们重启的进展。
  • DrhelpDrhelp 成员职位:17因素二世
    还是不行。从共享日志文件中有什么想法吗?
  • mmichelmmichel 员工,成员职位:129RM工程
    2019年11月编辑
    嗨Drhelp,
    agent.log指示容器在启动期间超时,因为它在3分钟内没有达到正常状态:
    2019-11-25 18:39:43.115 ERROR 17226 - [taskScheduler-1] c.r.e.j.service.JobContainerService:作业容器'1'启动超时,超过180000毫秒。
    造成这种情况的原因可能有很多:
    • 这台机器的性能不够好
    • 机器忙于并行地做其他事情
    • 扩展会减慢启动速度——你可能想要删除那些你不需要的
    一般来说,应该在这里检查container.log文件。它包含启动过程,并可能提供一些额外的见解,为什么启动不成功。如果超时无法避免,您也可以修改超时值,并通过agent.properties将其增加到5分钟:
    jobagent.container.startupTimeout = 300000
    希望这对你有所帮助
    马塞尔
    Pavithra_Rao sgenzer
  • DrhelpDrhelp 成员职位:17因素二世
    嗨,烫发。谢谢你的回复。

    不幸的是,我找不到任何container.log文件。它应该在哪里?我在我的电脑上找遍了,没有这样的东西。此外,没有“jobagent.container”。startupTimeout = 300000"行在agent.properties。

    RM服务器进程仍然挂起,没有启动。我已经从Studio中删除了大部分扩展,我不明白我的机器的性能如何可能不足(使用具有16GB RAM的MacBook Pro)或关于机器并行做其他事情的位(这不是RM服务器的目的之一吗?但停止其他东西并重新开始并没有帮助)。

    如能提供进一步的帮助和建议,我将不胜感激。谢谢你!
  • mmichelmmichel 员工,成员职位:129RM工程
    2019年11月编辑
    嗨Drhelp,
    不幸的是,我找不到任何container.log文件。它应该在哪里?
    应该将container.log文件放在与agent.log文件相同的目录中。所以,美元ja-home /日志/ container-x.log。我认为在您的情况下,JC过程从未出现,因此没有创建日志文件。这也表明:
    [taskScheduler-1] c.r.e.j.s eservice . jobcontainerservice: Job container '1'不能被杀死,因为相关PID未定义
    startupTimeout属性没有在现有的配置模板中列出,但是您仍然可以将它添加到agent.properties中。
    我已经从Studio中删除了大部分扩展,我不明白我的机器的性能是如何不足的(使用16GB RAM的MacBook Pro)
    这不是关于Studio扩展,而是关于Server或JobAgent的扩展。但我猜在你的情况下,这似乎是一个配置问题。如果您在16GB的机器上运行作业代理,您还应该相应地限制内存量。目前它的配置是65536MB,这显然大于您的容量。因此,请将内存限制更新为有效的内容(agent.properties),例如:
    jobagent.container.memoryLimit = 4096
    希望这能帮到你,
    马塞尔
  • DrhelpDrhelp 成员职位:17因素二世
    谢谢,烫发。我按照建议将jobagent.container.memoryLimit的配置更改为4096MB,重新启动RM Server并尝试运行另一个进程,但没有成功。还有其他问题吗?
  • DrhelpDrhelp 成员职位:17因素二世
    嗨,烫发。谢谢你的帮助和努力。我按照您建议的使用JDK8对JAVA_HOME进行了更改,但它仍然不起作用。也许我应该卸载并重新开始?从你的技术角度来看,任何其他可能导致问题的原因都会很有帮助。多谢。
  • mmichelmmichel 员工,成员职位:129RM工程
    您能再次上传您的agent.log文件吗?
  • DrhelpDrhelp 成员职位:17因素二世
    请参阅所附的agent.log文件。谢谢你!
    agent.log 2.3米
  • DrhelpDrhelp 成员职位:17因素二世
    现在起作用了,马塞尔!真的非常感谢你。你应该得到奖金!;)
    mmichel MartinLiebig
登录注册置评。