RapidMiner服务器的Docker映像
下面的文档描述了以下Docker映像:
- RapidMiner服务器(
rapidminer / rapidminer-server:最新
) - RapidMiner服务器与Python环境管理器支持(
rapidminer / rapidminer-server: latest-python
)
此图像可在上下载码头工人中心.
描述
此映像包含一个RapidMiner Server实例,它允许您使用可伸缩的架构.它至少需要一个连接工作代理人能够执行RapidMiner进程。
有关可用版本,请参阅标签:
我们为试验和测试目的创建了一个自包含的部署,其中包含一个嵌入式作业代理和一个数据库。您应该只使用它来了解RapidMiner Server及其特性。阅读自包含部署的详细信息下面.
引导程序
RapidMiner服务器将用户配置保存在数据库和文件系统中RapidMiner主目录.该映像可以与现有的持久配置一起使用,也可以不使用。我们实现了一个可选的初始化过程这是强制性的启动程序,它在每次容器启动时执行。
启动时没有安装现有的RapidMiner主卷(空挂载点)和空数据库将触发初始化过程:
- 使用默认的RapidMiner主文件夹内容初始化挂载的空卷
- 如果提供,则检查外部提供的JDBC驱动程序(
/ jdbc-drives
卷挂载)、JDBC_JAR_FILENAME
而且JDBC_DRIVER_CLASS
参数。 - 基于可选提供的JDBC设置和/或
DBTYPE
参数在RapidMiner Server / JBoss中配置JDBC驱动程序模块和数据源定义。我们为PostgreSQL、Microsoft SQL和Oracle数据库提供默认的JDBC驱动程序,但不为MySQL提供。如果您喜欢其他版本,而不是使用默认的JDBC驱动程序,那么您还可以使用前面提到的JDBC驱动程序配置来提供您的自定义JDBC驱动程序。 - 使用默认内容执行RapidMiner数据库初始化(在使用Hibernate技术启动RapidMiner Server / JBoss期间)
提供一个现有的(非空的)RapidMiner主卷和初始化的RapidMiner数据库内容将跳过初始化过程(例如,跳过JDBC驱动程序初始化,不加载默认的RapidMiner主目录和默认的数据库内容),并继续启动程序:
- 如果使用外部参数提供,则可选地配置数据库连接(主机、端口、用户名和密码)
- 如果使用外部参数提供,可选地配置ActiveMQ凭据(用户名和密码)
- 执行外部安装的可选引导脚本(
/ bootstrap.d
卷挂载) - 启动RapidMiner Server / JBoss。
配置
- 卷
/ persistent-rapidminer-home
:卷挂载,它存储了RapidMiner的主文件夹,包括所有的配置文件,扩展名,许可证,日志和存储库数据。看到下面的数据持久性一章了解更多细节。/ bootstrap.d
:可选启动时配置脚本的卷挂载,这些脚本在初始化阶段之后执行,但在RapidMiner Server (JBoss)启动之前执行。/ jdbc-drives
:卷来挂载外部提供的JDBC驱动程序jar文件(例如MySQL数据库)
- 港口:
- 端口为1081和1082,用于Radoop Proxy通信
- 5672端口,用于ActiveMQ通信
- 8080端口,用于web界面
- 环境变量:
DBTYPE
:如果你启动容器没有现有的数据库和初始化的RapidMiner主文件夹,那么你可以设置这个变量为一个支持的数据库平台(mysql, pgsql, mssql或oracle),以便使用(执行初始化过程)所需的数据库类型。缺省值:pgsql。通过选择MySQL作为数据库类型,您还应该提供JDBC驱动程序jar文件,由于其许可条件,它没有与我们的组件打包在一起。DBHOST
,DBPORT
,dbus
,DBPASS
,DBSCHEMA
:设置这些变量,配置RapidMiner Server连接外部数据库。如果提供的数据库为空,它将被初始化为一个RapidMiner Server数据库。JDBC_JAR_FILENAME
:如果您将外部JDBC驱动程序jar文件挂载到/ jdbc驱动程序
挂载点,那么您应该在初始化过程来获取并使用该驱动程序。JDBC_DRIVER_CLASS
:该参数可与JDBC_JAR_FILENAME
.如果设置了,那么这个Java类将在RapidMiner Server DataSource定义中指定。如果您不指定任何内容,那么我们的引导过程将根据提供的JDBC jar文件尝试猜测Java类名。BROKER_ACTIVEMQ_USERNAME
而且BROKER_ACTIVEMQ_PASSWORD
:用于服务器与其连接的作业代理之间通信的ActiveMQ服务的凭据JOBSERVICE_AUTH_SECRET
:用于服务器与其连接的作业代理之间通信的身份验证秘密。您必须为作业代理提供相同的秘密,以支持它们之间的通信。这里需要一个Base64编码的字符串。PROXY_INTERNALPROXIES
,PROXY_HTTP_PORT
而且PROXY_HTTPS_PORT
:如果使用反向代理后的RapidMiner Server,你可以设置这些值让RapidMiner Server知道代理,它的端口和基于这些参数RapidMiner Server可以建立外部url(例如重定向)。PROXY_INTERNALPROXIES
对象的网络定义应该包含RemoteIpValve模块内部使用的internalagents参数.默认包含10/8、192.168/ 16、169.254/ 16、127/8、172.16/12网络。PROXY_HTTP_PORT
而且PROXY_HTTPS_PORT
默认值为80和443。
INTERACTIVE_MODE
:将此变量设置为“1”将启动交互式bash shell,而不启动RapidMiner Server进程。服务器可以配置,插件可以安装,然后可以手动启动RapidMiner服务器进程。仅用于故障排除。TZ
:基于TZ数据库格式的时区规范。美国/ New_York
)PA_BASE_URL
:访问Platform Admin组件的HTTP URL。只在python
图像的版本。SSO_PUBLIC_URL
,SSO_IDP_REALM
,SSO_CLIENT_ID
,SSO_CLIENT_SECRET
: RapidMiner身份和安全配置。自动填充初始化服务.SERVER_MAX_MEMORY
: RapidMiner Server可以使用的最大内存量。LEGACY_REST_BASIC_AUTH_ENABLED
:允许在服务器REST端点上进行HTTP基本认证。默认为假
.启用它应该只考虑到遗留的原因,因为它降低了安全性。JUPYTER_URL_SUFFIX
,GRAFANA_URL_SUFFIX
:可访问JupyterHub和dashboard的外部URL后缀。
数据持久性
的RapidMiner主目录存储与RapidMiner Server映像连接的所有数据和配置。
要使此数据持久,请确保在启动容器时使用挂载点上挂载的卷/ persistent-rapidminer-home
.
- 如果挂载的卷是空的,那么默认配置和数据内容将被传播到它,以便RapidMiner Server在初始化阶段.
- 如果卷包含来自以前任何执行的数据,则服务器将使用该数据启动。
该卷将包含所有配置文件、扩展、许可证、日志和存储库数据。第一次执行后(挂载空卷),可以编辑以下数据:
- 扩展可以通过将它们添加到文件夹中来安装
< >体积/资源/乐鱼体育安装扩展
- 许可证可以安装在
< >体积/资源/乐鱼体育安装许可证
- 可以通过存储在的文件调优配置
< >体积/配置
很高兴知道
- RapidMiner服务器至少需要8GB内存。在Windows主机上,请确保Docker引擎配置为使用足够的内存运行。
- 许可证挂载点应该是一个标准的RapidMiner许可证文件夹,其中包含名为
rapidminer-server
,rapidminer-studio
,radoop
. - 要在Windows系统上挂载卷,您应该注意Windows特定的Docker卷挂载设置:
- 确保该驱动器在Docker设置中是共享的
- 如果使用docker-compose,考虑设置环境变量"COMPOSE_CONVERT_WINDOWS_PATHS=1"
- 确保Docker能够读写挂载的文件和文件夹
独立的部署
这只是为了在自己的计算机上进行快速的单用户测试。在这些部署中没有实现数据持久性。所有其他目的都从我们的部署模板.
自包含部署使用嵌入式作业代理和数据库来完成任务。要启动一个自包含的部署,需要指定以下环境变量:
EMBEDDED_DATABASE
:设置为“1”,以启动容器中的嵌入式PostgreSQL数据库服务器。注意,没有实现使用嵌入式数据库服务器的数据持久性。BUNDLED_JOB_AGENT
:设置为“1”,以启动捆绑的Job AgentJOBAGENT_QUEUE_ACTIVEMQ_USERNAME
,JOBAGENT_QUEUE_ACTIVEMQ_PASSWORD
:用于服务器和捆绑作业代理之间通信的ActiveMQ服务的凭据JOBAGENT_AUTH_SECRET
:配置绑定的作业代理的身份验证秘密。这里需要一个Base64编码的字符串。