使用Tableau表写入器
的Tableau表编写器扩展允许导出数据为.tde或.hyper Tableau提取文件直接从RapidMiner Studio。它还允许你上传你的.tde或.hyper文件到Tableau服务器。本文档将引导您完成这些功能的安装和使用。
该扩展运行在Windows(64位),Mac OS X(64位)和Linux发行版(64位)上。
安装Tableau Table Writer扩展
要使用Tableau表Writer扩展,您需要首先安装:
- 表SDK如果你使用的是Tableau 10.4或更早的版本,或者
- 数据提取API 2.0适用于Tableau 10.5或更高版本。
注意,Tableau SDK创建.tde提取文件,Tableau数据提取写入新的.hyper格式。如果不更改设置并重新启动RapidMiner Studio或服务器,就无法从一种格式更改为另一种格式。
下载适当的API (C/ c++ /Java 64位版本),并根据目标平台的不同,在Windows、Mac OS或Linux上按以下指示操作。注意,扩展还支持弃用Tableau提取API用于向后兼容,但不再推荐使用。
SDK/API以ZIP存档的形式提供。将存档的所有内容提取到您的硬盘驱动器,例如,到您的文件夹下程序文件文件夹中。我们将使用文件夹名称
数据提取API
举个例子。打开高级系统设置然后点击环境变量.
将数据提取API的位置添加到系统中
路径
变量系统变量,例如,如果你提取API到C:\Program Files\Tableau数据提取API
,添加C:\Program Files\Tableau Data Extract API\bin
到变量值的末尾(请注意开头的分号)。控件中添加一个新条目用户变量而且系统变量列表也叫做
TAB_SDK_TMPDIR
.指定用户有写权限的位置,例如:C:\Users\ < yourusername > \文档
,在那里< yourusername >
是您的用户名。如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有正确启动.也建议添加
TAB_SDK_LOGDIR
到用户变量而且系统变量列表并将其设置为相同的目录TAB_SDK_TMPDIR
点。数据抽取操作将被记录到指定目录下的日志文件中。
SDK/API以图像(.dmg)文件的形式提供。打开下载的.dmg文件。
中拖动所有文件
框架
目录/图书馆/框架
.你可能会被要求输入密码。指定环境变量
TAB_SDK_TMPDIR
指向用户有写权限的位置,例如:/ tmp
.执行此操作的步骤可能取决于您的OS X版本,请参阅下面的示例。如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有在回调端口上回调.
对于OS X High Sierra,您可以按照以下步骤永久地设置环境变量:
创建一个plist文件,例如,
com.rapidminer.tableauTableWriter.plist
下~ /图书馆/ LaunchAgents /
:<?xml version="1.0" encoding="UTF-8"?> < !DOCTYPE plist PUBLIC "-//Apple//DTD plist 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
Label com.rapidminer。tableauTableWriter ProgramArguments sh -c launchctl setenv TAB_SDK_TMPDIR /tmp RunAtLoad 激活这plist文件,因此这些更改会立即使用,而不是在重启后才使用:
launchctl load ~/Library/LaunchAgents/com.rapidminer.tableauTableWriter。plistlaunchctl start ~/Library/LaunchAgents/com.rapidminer.tableauTableWriter.plist
对于较旧的OS X版本,查看这篇文章.
SDK/API以存档文件的形式提供(您也可以使用.deb或.rpm版本)。下载到例如,your
$ HOME /表
文件夹中。您可以使用命令行提取文件:
tar xvf $HOME/tableau/*.tar.gz
.这可能会提取一个带有名称的子目录,具体取决于版本,但是在下面的步骤中,为了简单起见,我们将忽略这个子目录。确保您检查了您正在使用的路径。添加提取的位置
箱子
到您的路径
变量,例如,如果你直接提取API到$ HOME /表
,添加$ HOME /表/ bin
对变量。您可能需要指定环境变量
TAB_SDK_TMPDIR
指向用户有写权限的位置,例如:/ tmp
.如果没有指定此文件夹,并且用户不能写入默认的(例如RapidMiner Studio安装目录),则可能会得到一个错误提示Hyper Server没有正确启动.
在RapidMiner Studio中运行Tableau扩展时,需要确保将Tableau库加载到共享库缓存中。遵循以下步骤来实现这一目标:
中创建一个空文件
等/ ld.so.conf.d
发行目录$ sudo touch /etc/ld.so.conf.d/tableau_lib.conf
文件的绝对路径tableausdk库。例如,遵循
$ HOME /表/
上面的图案,粘贴$ HOME /表/ lib64 / tableausdk
放入文件中。使用新的库更新库缓存
sudo ldconfig
.要检查库是否已经加载,请运行sudo ldconfig -p | grep libTableauCommon.so .so .使用实例
或者,您可以通过设置(临时或永久)LD_LIBRARY_PATH
改为环境变量:
- 集
LD_LIBRARY_PATH
的绝对路径tableausdk库。例如,遵循$ HOME /表/
上面的模式,使用$ HOME /表/ lib64 / tableausdk
.
一旦Tableau SDK /数据提取API正确安装,您可以继续从RapidMiner市场安装Tableau表写扩展:
导出数据为Tableau的格式
从RapidMiner Studio导出数据为.tde或.hyper文件时,执行以下步骤:
选择编写表格摘录接线员:
导入并选择数据文件,例如,从您的本地存储库:
连接“out”端口和“inp”端口:
为输出文件选择一个路径。tde或.hyper文件扩展名,具体取决于使用SDK或Extract API 2.0):
将“thr”端口与“res”端口连接,在RapidMiner Studio中查看结果:
运行您的流程来启动导出!
上传到Tableau服务器
方法将.tde或.hyper数据源上传到Tableau服务器上传Tableau数据源扩展提供的运算符。你需要一个表服务器在指向目标Tableau Server实例的地方定义的连接项。请按照连接编辑器对话框中字段旁边的工具提示测试您的连接。
结合这两个操作符可以直接将RapidMiner数据源上传到Tableau Server。首先,将输入数据转换为Tableau数据格式编写表格摘录操作符,则无需指定本地输出路径,只需将“fil”(文件)输出端口直接连接到的“fil”输入端口上传Tableau数据源.通过这种方式,将使用本地临时文件进行转换,一旦过程完成,将自动从本地磁盘删除该文件。在下面的示例中,上传操作符在其“con”输入端口上接收Tableau Server连接,但您也可以使用操作符的连接条目参数。