MySQL和RapidMiner

Edin_KlapicEdin_Klapic 主持人、员工、RMResearcher、会员职位:299RM数据科学家
2018年11月编辑 知识库

问题

我需要知道什么,如果我想使用MySQL数据库与RapidMiner?

回答

一般来说,有两件事你需要知道并注意。

1.设置与数据库的连接

在RapidMiner Studio中,您可以通过创建数据库连接进行连接,如知识库文章。

如果你想在MySQL上安装RapidMiner Server,你需要下载一个MySQL连接器,并按照安装说明篇文章。

2.存储大型(r)数据集的设置

  • MySQL变量'max_allowed_packet'定义了从MySQL服务器发送或接收的一个数据包的大小。在MySQL 5.7版本中,这个变量默认设置为4MB或16MB,最大值为1GB。因此,如果在MySQL中存储一个RapidMiner ExampleSet终止,类似于:
    . com.mysql.jdbc.PacketTooBigException:查询包太大(30237356 > 16777216)。您可以通过设置max_allowed_packet'变量在服务器上更改此值。
    您可能希望在MySQL服务器环境的选项文件中调整此值并重新启动服务器。如果你使用MySQL工作台,你可以在这里找到设置:

max_packet.PNG

  • RapidMiner服务器变量“com.rapidanalytics.db”。max_rowlength'反映了RapidMiner用于存储对象的每行最大字节数。根据MySQL使用的存储引擎,每个exampleeset最多只能存储1000列。有关数据库允许的最大列数的信息,请咨询数据库管理员。为了提前避免冲突,我们建议将这个变量的值从默认的20,000降低到15,000或10,000字节,并确保您只存储具有许多列的ExampleSets,这些列不超过最大值。
  1. 在RapidMiner服务器web界面中以用户'admin'登录
  2. 导航到“管理”=>“系统设置”。
  3. 如果变量` com.rapidanalytics.db. `未列出max_rowlength -单击“添加属性”
  4. 输入com.rapidanalytics.db.max_rowlength在野外财产15000年在野外价值
  5. 点击“提交”variabe.PNG

现在你应该为你的工作与RapidMiner和MySQL:smileyhappy:

最好的

艾丁

评论

  • luc_bartkowskiluc_bartkowski 成员职位:46Maven

    @Edin_Klapic

    还请注意,MySQL视图不会出现在“读取数据库”操作符的“表”列表中。

    但是,您可以在此操作符的“SQL Query”部分中包含SQL“SELECT * FROM view_name”。

    问候,

    卢克

登录注册置评。