类别

版本

使用Tableau表写入器

Tableau表编写器扩展允许导出数据为.tde或.hyper Tableau提取文件直接从RapidMiner Studio。它还允许你上传你的.tde.hyper文件到Tableau服务器。本文档将引导您完成这些功能的安装和使用。

该扩展运行在Windows(64位),Mac OS X(64位)和Linux发行版(64位)上。

安装Tableau Table Writer扩展

要使用Tableau表Writer扩展,您需要首先安装:

  • 表SDK如果你使用的是Tableau 10.4或更早的版本,或者
  • 数据提取API 2.0适用于Tableau 10.5或更高版本。

注意,Tableau SDK创建.tde提取文件,Tableau数据提取写入新的.hyper格式。如果不更改设置并重新启动RapidMiner Studio或服务器,就无法从一种格式更改为另一种格式。

下载适当的API (C/ c++ /Java 64位版本),并根据目标平台的不同,在Windows、Mac OS或Linux上按以下指示操作。注意,扩展还支持弃用Tableau提取API用于向后兼容,但不再推荐使用。

  1. SDK/API以ZIP存档的形式提供。将存档的所有内容提取到您的硬盘驱动器,例如,到您的文件夹下程序文件文件夹中。我们将使用文件夹名称数据提取API举个例子。

  2. 打开高级系统设置然后点击环境变量

  3. 将数据提取API的位置添加到系统中路径变量系统变量,例如,如果你提取API到C:\Program Files\Tableau数据提取API,添加C:\Program Files\Tableau Data Extract API\bin到变量值的末尾(请注意开头的分号)。

  4. 控件中添加一个新条目用户变量而且系统变量列表也叫做TAB_SDK_TMPDIR.指定用户有写权限的位置,例如:C:\Users\ < yourusername > \文档,在那里< yourusername >是您的用户名。如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有正确启动

  5. 也建议添加TAB_SDK_LOGDIR用户变量而且系统变量列表并将其设置为相同的目录TAB_SDK_TMPDIR点。数据抽取操作将被记录到指定目录下的日志文件中。

  1. SDK/API以图像(.dmg)文件的形式提供。打开下载的.dmg文件。

  2. 中拖动所有文件框架目录/图书馆/框架.你可能会被要求输入密码。

  3. 指定环境变量TAB_SDK_TMPDIR指向用户有写权限的位置,例如:/ tmp.执行此操作的步骤可能取决于您的OS X版本,请参阅下面的示例。如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有在回调端口上回调

对于OS X High Sierra,您可以按照以下步骤永久地设置环境变量:

  1. 创建一个plist文件,例如,com.rapidminer.tableauTableWriter.plist~ /图书馆/ LaunchAgents /

    <?xml version="1.0" encoding="UTF-8"?> < !DOCTYPE plist PUBLIC "-//Apple//DTD plist 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">   Label com.rapidminer。tableauTableWriter ProgramArguments  sh -c launchctl setenv TAB_SDK_TMPDIR /tmp  RunAtLoad   
  2. 激活这plist文件,因此这些更改会立即使用,而不是在重启后才使用:

    launchctl load ~/Library/LaunchAgents/com.rapidminer.tableauTableWriter。plistlaunchctl start ~/Library/LaunchAgents/com.rapidminer.tableauTableWriter.plist

对于较旧的OS X版本,查看这篇文章

  1. SDK/API以存档文件的形式提供(您也可以使用.deb或.rpm版本)。下载到例如,your$ HOME /表文件夹中。

  2. 您可以使用命令行提取文件:tar xvf $HOME/tableau/*.tar.gz.这可能会提取一个带有名称的子目录,具体取决于版本,但是在下面的步骤中,为了简单起见,我们将忽略这个子目录。确保您检查了您正在使用的路径。

  3. 添加提取的位置箱子到您的路径变量,例如,如果你直接提取API到$ HOME /表,添加$ HOME /表/ bin对变量。

  4. 您可能需要指定环境变量TAB_SDK_TMPDIR指向用户有写权限的位置,例如:/ tmp.如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有正确启动

在RapidMiner Studio中运行Tableau扩展时,需要确保将Tableau库加载到共享库缓存中。遵循以下步骤来实现这一目标:

  1. 中创建一个空文件等/ ld.so.conf.d发行目录$ sudo touch /etc/ld.so.conf.d/tableau_lib.conf

  2. 文件的绝对路径tableausdk库。例如,遵循$ HOME /表/上面的图案,粘贴$ HOME /表/ lib64 / tableausdk放入文件中。

  3. 使用新的库更新库缓存sudo ldconfig.要检查库是否已经加载,请运行sudo ldconfig -p | grep libTableauCommon.so .so .使用实例

或者,您可以通过设置(临时或永久)LD_LIBRARY_PATH改为环境变量:

  1. LD_LIBRARY_PATH的绝对路径tableausdk库。例如,遵循$ HOME /表/上面的模式,使用$ HOME /表/ lib64 / tableausdk

一旦Tableau SDK /数据提取API正确安装,您可以继续从RapidMiner市场安装Tableau表写扩展:

导出数据为Tableau的格式

从RapidMiner Studio导出数据为.tde或.hyper文件时,执行以下步骤:

选择编写表格摘录接线员:

导入并选择数据文件,例如,从您的本地存储库:

连接“out”端口和“inp”端口:

为输出文件选择一个路径。tde或.hyper文件扩展名,具体取决于使用SDK或Extract API 2.0):

将“thr”端口与“res”端口连接,在RapidMiner Studio中查看结果:

运行您的流程来启动导出!

上传到Tableau服务器

方法将.tde或.hyper数据源上传到Tableau服务器上传Tableau数据源扩展提供的运算符。你需要一个表服务器在指向目标Tableau Server实例的地方定义的连接项。请按照连接编辑器对话框中字段旁边的工具提示测试您的连接。

结合这两个操作符可以直接将RapidMiner数据源上传到Tableau Server。首先,将输入数据转换为Tableau数据格式编写表格摘录操作符,则无需指定本地输出路径,只需将“fil”(文件)输出端口直接连接到的“fil”输入端口上传Tableau数据源.通过这种方式,将使用本地临时文件进行转换,一旦过程完成,将自动从本地磁盘删除该文件。在下面的示例中,上传操作符在其“con”输入端口上接收Tableau Server连接,但您也可以使用操作符的连接条目参数。