写数据库(JDBC连接器)
剧情简介
该操作符将ExampleSet写入SQL数据库。描述
Write Database操作符用于将ExampleSet写入指定的SQL数据库。为了正确使用此操作符,您至少需要对数据库和数据库连接有基本的了解。通过参数和附带的示例过程来理解这个操作符的流程。
用户可以指定数据库连接和表名。请注意,如果表不存在,将在写入时创建。定义必要参数的最方便方法是管理数据库连接向导。最重要的参数(数据库URL和用户名)将由该向导自动确定。最后,您只需要定义表名。该操作符只支持编写完整的ExampleSet,该ExampleSet由所有常规属性和特殊属性以及所有示例组成。如果不希望这样,在应用Write Database操作符之前,执行一些预处理操作符,如Select Attributes或Filter Examples操作符。RapidMiner可以通过使用read database操作符读取数据库表中的数据。
输入
- 输入(数据表)
这个输入端口需要一个ExampleSet。它是附带的示例流程中检索操作符的输出。
- 连接(连接)
这个输入端口需要一个Connection对象(如果有的话)。有关更多信息,请参阅参数连接项。
输出
- 通过(数据表)
在输入端口提供的ExampleSet通过这个输出端口交付,不需要任何修改。这通常用于在流程的进一步操作符中重用相同的ExampleSet。
- 连接(连接)
这个输出端口从输入端口传递Connection对象。如果输入端口未连接,则端口不发送任何内容。
参数
- define_connection此参数指示如何指定数据库连接。它提供了四个选项:repository、预定义的、url和jndi。参数是不可见的连接输入端口已连接。选择范围:
- connection_entry此参数仅在定义连接参数设置为存储库。此参数用于指定表示连接项的存储库位置。也可以使用连接输入端口。范围:字符串
- 连接此参数仅在定义连接参数设置为预定义的。此参数用于使用预定义连接连接到数据库。您可以有许多预定义的连接。您可以使用下拉框选择其中一个。您可以使用下拉框旁边的按钮添加新连接或修改以前的连接。您也可以通过单击来完成此操作管理数据库连接…从工具主窗口中的菜单。将出现一个新窗口。这个窗口要求提供一些细节信息,例如:主机、端口、数据库系统、模式、用户名和密码。的测试按钮将允许您检查是否可以建立连接。测试成功后保存连接。的下拉框中选择新的连接连接参数。要配置连接,您需要对数据库有基本的了解。范围:字符串
- database_system此参数仅在定义连接参数设置为url。该参数用于选择正在使用的数据库系统。选择范围:
- database_url此参数仅在定义连接参数设置为url。此参数用于定义数据库的URL连接字符串,例如:“jdbc: mysql: / / foo.bar: portnr /数据库”。范围:字符串
- 用户名此参数仅在定义连接参数设置为url。该参数用于指定数据库的用户名。范围:字符串
- 密码此参数仅在定义连接参数设置为url。该参数用于指定数据库的密码。范围:字符串
- jndi_name此参数仅在定义连接参数设置为jndi。该参数用于为JNDI提供数据源的名称。范围:字符串
- table_name此参数用于从指定的数据库中选择所需的表。请注意,您也可以在这里写入表名,如果表不存在,将在写入时创建。范围:
- overwrite_mode此参数指示是应该覆盖现有表,还是应该向现有数据追加数据。选择范围:
- set_default_varchar_length该参数用于设置varchar列为默认长度。范围:布尔
- default_varchar_length此参数仅在设置默认varchar长度参数设置为true。的默认长度varchar列。范围:整数
- add_generated_primary_keys该参数指示是否应该将包含自动生成主键的新属性添加到数据库中的表中。范围:布尔
- db_key_attribute_name此参数仅在添加生成的主键参数设置为true。此参数指定自动生成的主键的属性名称。范围:字符串
- batch_size此参数指定使用单个查询一次写入数据库的示例数量。较大的值可以大大提高速度。但是,太大的值会大大降低性能。此外,一些数据库对一次写入值的最大数量有限制。设置为0表示禁用批处理。范围:整数
教程的过程
编写一个ExampleSet到mySQL数据库
使用Retrieve操作符加载'Golf'数据集。Write Database操作符用于将该数据集写入mySQL数据库。定义连接参数被设置为预定义的,并使用下拉框旁边的按钮进行配置。连接的名称设置为'mySQLconn'。在连接参数的向导中设置以下值:数据库系统设置为“mySQL”。主机设置为'localhost'。端口设置为“3306”。数据库方案设置为“高尔夫”;这是数据库的名称。用户设置为“root”。 No password is provided. You will need a password if your database is password protected. Set all the values and test the connection. Make sure that the connection works.
表名参数设置为'golf_table',这是'golf'数据库中所需表的名称。运行该进程,您将在Results工作区中看到整个'golf_table'。你也可以在phpmyadmin中查看'golf'数据库来查看'golf_table'。您可以使用read database操作符从数据库中读取该表。有关更多信息,请研究读取数据库操作符的示例过程。