MySQL和RapidMiner
Edin_Klapic
主持人、员工、RMResearcher、会员职位:299RM数据科学家
问题
我需要知道什么,如果我想使用MySQL数据库与RapidMiner?
回答
一般来说,有两件事你需要知道并注意。
1.设置与数据库的连接
在RapidMiner Studio中,您可以通过创建数据库连接进行连接,如这知识库文章。
如果你想在MySQL上安装RapidMiner Server,你需要下载一个MySQL连接器,并按照安装说明这篇文章。
2.存储大型(r)数据集的设置
- MySQL变量'max_allowed_packet'定义了从MySQL服务器发送或接收的一个数据包的大小。在MySQL 5.7版本中,这个变量默认设置为4MB或16MB,最大值为1GB。因此,如果在MySQL中存储一个RapidMiner ExampleSet终止,类似于:
. com.mysql.jdbc.PacketTooBigException:查询包太大(30237356 > 16777216)。您可以通过设置max_allowed_packet'变量在服务器上更改此值。
您可能希望在MySQL服务器环境的选项文件中调整此值并重新启动服务器。如果你使用MySQL工作台,你可以在这里找到设置:
- RapidMiner服务器变量“com.rapidanalytics.db”。max_rowlength'反映了RapidMiner用于存储对象的每行最大字节数。根据MySQL使用的存储引擎,每个exampleeset最多只能存储1000列。有关数据库允许的最大列数的信息,请咨询数据库管理员。为了提前避免冲突,我们建议将这个变量的值从默认的20,000降低到15,000或10,000字节,并确保您只存储具有许多列的ExampleSets,这些列不超过最大值。
- 在RapidMiner服务器web界面中以用户'admin'登录
- 导航到“管理”=>“系统设置”。
- 如果变量` com.rapidanalytics.db. `未列出max_rowlength -单击“添加属性”
- 输入com.rapidanalytics.db.max_rowlength在野外财产和15000年在野外价值
- 点击“提交”
现在你应该为你的工作与RapidMiner和MySQL:smileyhappy:
最好的
艾丁
0
评论
@Edin_Klapic,
还请注意,MySQL视图不会出现在“读取数据库”操作符的“表”列表中。
但是,您可以在此操作符的“SQL Query”部分中包含SQL“SELECT * FROM view_name”。
问候,
卢克