类别

版本

您正在查看9.7 -版本的RapidMiner Radoop文档点击这里查看最新版本

RapidMiner Radoop属性设置

下表描述了影响RapidMiner Radoop运行的一般设置。它们被发现在RapidMiner Studio > Settings > Preferences下拉菜单对话框,在Radoop选项卡。控制执行的所有其他设置都位于连接设置中。看到配置Radoop连接界面以获取完整的列表。

注意,每个内部键都以前缀开头rapidminer.radoop

杂项

财产 内部关键 默认值 描述
汽车描述 auto_describe 禁用 切换连接或刷新后是否自动描述所有Hive对象。选项上的切换按钮的状态Hadoop数据视图。Hive对象的所有元数据都是立即提取的,如果有很多对象,这可能会很慢。
描述最大错误 describe.max_errors 5 设置错误的阈值。的Hadoop数据如果视图在描述Hive对象时遇到的错误超过此限制,则认为连接失败。你可能需要增加这个值,例如,如果你有很多Hive对象在描述时出错(例如,缺少自定义输入/输出格式类)。

样本大小

财产 内部关键 默认值 描述
总体样本量 sample_size.overall 200000 设置Hadoop数据集在巢输出上的样本大小。的输出Radoop巢,它被提取到客户端机器的内存中。使用此值限制数据(样本)的大小。值为0表示满样本。
样本量断点 sample_size.breakpoint 1000 在进程中的断点之后,在Hadoop data视图中设置Hadoop数据集的样本大小。当您使用断点暂停RapidMiner Radoop进程时,已处理数据的样本将被提取到客户端机器的内存中,以便手工检查。使用此值定义示例中的行数。Hadoop数据视图在浏览表时也使用了这个限制。值为0表示满样本。

日志记录

财产 内部关键 默认值 描述
启用log4j日志 log4j 禁用 确定是否应该将log4j日志收集到用户文件夹中。
Log4j属性文件 log4j . properties 如果启用了log4j日志收集,并且希望使用自己的log4j。属性文件,在这里定义其位置。该文件必须包含log4j。属性,它定义了日志级别和要附加的追加程序。

JDBC连接池

财产 内部关键 默认值 描述
连接池大小 connection_pool.fast_statement.size 8 Hive JDBC连接池大小。如果你想并行运行许多操作(例如在RapidMiner服务器上),请增加它。
连接池超时 connection_pool.fast_statement.timeout 85 等待可用连接的超时时间(秒)。

日志记录

财产 内部关键 默认值 描述
启用log4j日志 radoop.log4j 禁用 确定是否应该将log4j日志收集到用户文件夹中。
Log4j属性文件 radoop.log4j.properties 如果打开了log4j日志收集,并且希望使用自己的log4j。属性文件,在这里定义其位置。该文件必须包含log4j。属性,它定义了日志级别和要附加的追加程序。