类别

版本

工作代理人

在启动时,作业代理生成可配置数量的作业容器作为单独的系统进程。作业代理负责通过REST通信将传入的作业从分配的队列重定向到本地生成的作业容器。生成的作业容器仅作为RapidMiner进程的执行单元。只要作业代理应用程序运行,作业容器就保持活动状态,并在管理作业代理关闭时自动关闭。

本页概述如何配置作业代理。详情请参阅体系结构页以阅读有关作业代理和作业容器结构概述的更多信息。

配置

代理的属性

您可以通过更改更改作业代理的配置{homeDir} / config /溶剂进行.每个属性都有一个注释,解释配置对代理和生成的作业容器的影响。除了生成作业容器的数量或每个作业容器使用的最大内存量之类的设置之外,还可以配置以下子节中概述的更复杂的行为。

集装箱港口

当作业容器在作业代理启动期间作为单独的系统进程生成时,它们被绑定到系统端口。这是必要的,因为作业代理通过REST端点与它们通信,例如重定向作业或检索作业的最新状态。作业代理程序将使用自定义的起始端口开始的连续端口。最后一个端口由配置的作业容器的数量决定,例如if1000定义为起始端口,总共要生成四个作业容器,作业代理会绑定这些端口吗100010011002而且1003.作业容器只在本地监听,无法从其他任何地方访问本地主机/127.0.0.1

容器重启策略

默认情况下,作业容器将无限期地运行,并且在作业执行后不会重新启动。通过这种行为,几乎可以立即执行大量的作业。一个可能的缺点是,当按顺序运行时,作业可能会对彼此产生影响。为了克服这个问题,可以将重新启动策略分配给作业容器。支持的重启策略是:无限期运行,在可配置数量的执行进程后终止,并通过cron表达式定期重新启动。当调用重新启动时,当前活动的作业执行将在作业容器重新启动之前完成。要更改此行为,可以设置jobagent.restart.timeout财产。作业代理将在执行时间超过此超时后强制终止作业容器,而不管作业代理是否仍在运行。

用于项目的容器缓存

当一个过程从一个项目由作业容器执行,作业容器将首先下载相应的项目文件,以便在执行期间使用它们。在流程完成后,这些临时工作文件将被删除。如果流程执行改变了项目文件,它们会自动添加为一个新的快照。

因为作业容器需要下载项目文件,所以大型项目需要时间,因此流程执行时间可能会因此增加。为了减少下载文件的初始时间,每个作业容器通过应用缓存策略来缓存已经下载的项目。在进行文件时,此行为可以通过更改的值来调整jobagent.container.repository.caching.strategy财产。默认情况下,Job Container将在缓存中保留两个Project,并在需要下载新Project时替换最近使用最少的Project。有关存在哪些不同的策略以及如何配置它们以满足您的需求的详细信息,请参阅中提供的属性描述进行文件。

Graceful Job Agent关闭

作业代理在默认情况下将等待所有作业执行完成后才关闭。但是,可以通过设置作业代理来避免这种情况jobagent.shutdown.timeout

容器的属性

您可以根据具体情况向作业容器添加属性你希望它们都是可用的。一般来说,作业容器以两种不同的方式引用它们的属性:

  1. 在启动和
  2. 当一个作业将要被执行时。

在开始

作业代理生成新的作业容器时,将执行上下文中定义的{homeDir} / config / rapidminer /。RapidMiner正在复制到作业容器,以便在执行期间使用它。如果您的扩展需要它,您可以将自己的配置文件放在这个目录中。

你也可以使用集中资源管理同步执行上下文RapidMiner服务器主文件夹

还可以在Job Container Studio初始化期间添加其他属性。如果你需要提供在Job Container启动期间已经需要的扩展属性,例如当操作符被注册时,这是特别有用的:

  • 使用jobagent.container.initWithProperties.enabled启用或禁用,默认为禁用
  • 使用jobagent.container.initWithProperties.location若要将绝对位置设置为属性文件,默认为rapidminer-init.properties{homeDir} / config / rapidminer /文件夹

这些属性文件不会自动同步,可能需要针对已部署的每个作业代理实例进行调整。

对一个新作业进行排队

向队列提交作业时,负责此队列的相应作业代理将拾取作业。然后将它通过REST转发到由该作业代理管理的作业容器。每当发生这种情况时,属性文件{homeDir} / config / rapidminer / rapidminer.properties是由作业代理读取的,它的内容被输送到作业中,以便作业容器可以将它们作为系统属性使用,因此在执行期间它们也暴露给扩展。请记住,新作业将覆盖这些属性。这意味着在执行之间更改文件会导致针对不同作业将不同的属性值传播到作业容器。

这个文件也可以是用于为作业容器提供自定义属性(例如扩展属性)但是在作业容器启动时还不需要。

容器JVM参数

作业容器由它们的作业代理启动,使用一组默认的JVM参数,例如XX: + UseG1GC

添加将转置到作业容器的附加参数,则编辑进行文件,并通过将其指定为类似于jobagent.container.jvmCustomOptions = -Dnew。属性= new -Danother.property =.它会转置-Dnew。属性= new -Danother.property =到由作业代理生成的每个作业容器。

请注意,整个财产的价值jvmCustomOptions将转置到作业容器的开始参数。任何错误都可能导致作业容器不再正确生成。

如果有必要,也可以重写所有默认JVM参数尽管我们强烈建议不要这么做。在某些用例中,这可能仍然是可行的和需要的。来覆盖你需要编辑进行文件并定义类似的内容jobagent.container.jvmProperties = Dtest.property1=test1,Dtest.property2=test2.确保您需要的任何默认参数仍然存在。对象中打印所有JVM默认参数agent.log作业代理启动时。

属性中没有前导连字符,属性用逗号分隔jvmProperties财产。

容器代理使用

方法在作业容器内配置代理使用情况rapidminer.properties文件内的美元jaHomeDir / config / rapidminer文件夹中。属性名与在内部配置代理时相同公司代理

从您的/ RapidMiner / rapidminer-studio-settings.cfg配置文件,例如如下。

rapidminer.proxy。rapidminer.proxy.http . proxyhost =myproxy.domain。tld rapidminer.proxy.https.proxyPort = 8443

作业容器将获取这些值,并在整个执行过程中使用它们。

如果您的代理需要身份验证,例如基本身份验证,请像在Studio中一样使用工作室的钱包管理您的密码。然后,复制.RapidMiner /加密而且.RapidMiner / credentials.xml文件放入执行上下文文件夹{homeDir} / config / rapidminer /。RapidMiner作业容器的。默认情况下,在作业容器启动期间将拾取必要的文件。用于此的默认对称密钥预期为{homeDir} / config / rapidminer / .RapidMiner /加密/对称/ default-local-context.rmek

乐鱼体育安装

为了使正确执行RapidMiner进程,作业代理使用各种外部资源,如JDBC驱动程序、RapidMiner扩展、自定义Java库和RapidMiner服务器许可证。乐鱼体育安装这些资源存储乐鱼体育安装在{homeDir} 乐鱼体育安装/资源/作业代理的文件夹。

集中资源管理

作业代理的外部资源集中管理,并从作业代理连接的Ra乐鱼体育安装pidMiner Server实例自动同步。也执行上下文将在默认情况下同步到所有作业代理。

资源管理

集中管理的作业代理资源存储在乐鱼体育安装资源/的文件夹RapidMiner服务器主文件夹.RapidMiner服务器和所有连接的作业代理都使用相同的资源集。乐鱼体育安装

要安装新的或管理现有的集中管理资源,请执行以下操作:乐鱼体育安装

  1. 选择要更新的资源类型(JDBC、扩展、自定义库)
  2. 从下表中找到要更新的资源类型的路径
  3. 通过从所选文件夹中添加或删除内容来更新资源类型
  4. 重启RapidMiner服务器。所有连接的作业代理将自动从RapidMiner Server同步新的资源配置。
类型 路径
JDBC < rapidminer-server-home 乐鱼体育安装> /资源/ jdbc /
扩展 < rapidminer-server-home 乐鱼体育安装> / /资源/扩展
自定义库 < rapidminer-server-home 乐鱼体育安装> /资源/ libs /
许可证 在许可证安装时,通过RapidMiner Server UI自动将许可证同步到连接的作业代理
执行上下文 < rapidminer-server-home > /。RapidMiner /

自动同步

默认情况下,在作业代理启动后,所乐鱼体育安装有资源和执行上下文将自动从RapidMiner Server实例同步。另外,资源在重启Ra乐鱼体育安装pidMiner Server实例后同步。

作业代理程序将资源下载到特定类型的资源文件夹中,并覆盖所乐鱼体育安装有潜在的现有文件。这些特定类型的资源文件夹是:

类型 路径
JDBC < jobagent-home 乐鱼体育安装> /资源/ jdbc /
扩展 < jobagent-home 乐鱼体育安装> / /资源/扩展
自定义库 < jobagent-home 乐鱼体育安装> /资源/ libs /
许可证 < jobagent-home 乐鱼体育安装> / /资源/许可
执行上下文 < jobagent-home > / config / rapidminer /。RapidMiner

个人资源管理

若要使用不同于集中管理的资源集的单个资源来设置作业代理,可通过设置禁用自动同步乐鱼体育安装Jobagent.sync.enabled = false配置/溶剂进行文件。作业代理重新启动后,它将只使用各自资源文件夹中已经可用的资源。乐鱼体育安装

要安装新的或管理现有的本地资源,请执行以下操作:乐鱼体育安装

  1. 关闭作业代理
  2. 定位要更新的资源类型的路径
  3. 通过从所选文件夹中添加或删除内容来更新资源类型
  4. 重新启动作业代理

资源类型

JDBC

JDBC连接可以在{homeDir} 乐鱼体育安装/资源/ jdbc / jdbc_properties.xml文件。

扩展

扩展从{homeDir} 乐鱼体育安装/ /资源/扩展目录中。

自定义库

自定义库是可以在RapidMiner进程中使用的Java库,例如在执行脚本操作符。可以将这些库添加到{homeDir} 乐鱼体育安装/资源/ libs /文件夹,然后它们就可以自动执行了。

不要将自定义库与JDBC驱动程序扩展

许可证

作业代理程序许可证安装在{homeDir} 乐鱼体育安装/资源/许可证目录中。

您可以定义生成的作业容器的数量(jobagent.container.count),以及每个作业容器的内存(jobagent.container.memoryLimit)在{homeDir} / config /溶剂进行文件。请记住,这些设置需要符合您当前的服务器许可证。

执行上下文

执行上下文为每个作业容器复制{homeDir} / config / rapidminer /。RapidMiner在作业容器启动期间。