python的subprocess.run()在Rapidminer中不起作用

lplenka · 2018年2月

朋友们好，我遇到了一些Python的麻烦subprocess.run ()在Execute Python操作符中。我正在使用Xpd阅读器的pdftotext从PDF文件中提取文本。当我运行该进程时，子进程似乎失败了，因为我总是得到一个空白文本文件。

系统细节:-

Windows 10

RapidMiner Studio 8.0

Python 3.6

<？xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>


< /操作符>
> < /过程

我找不到错误输出的任何原因。请帮助!

lplenka · 2018年2月

嘿@lionelderkrikor，

谢谢你的帮助。

对不起，之前的xml文件有一些错误。这是新的xml文件。

<？xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文







<过程扩展= " true " >


< /操作符>


> < /过程
< /操作符>
> < /过程

嗯，是的，当我在笔记本中运行或从cmd调用python脚本时，python脚本工作得很好。

我没有采取任何参数在rm_main()，因为这个脚本不需要任何，我希望文本被提取到“output.txt”在我的开车。所以也没有返回语句。

注意:

令人惊讶的是，我现在在“output.txt”文本文件中得到了提取的文本。我不知道为什么我昨晚没有输出。重启成功了吗?请在您的系统中交叉核对。谢谢你！

lionelderkrikor · 2018年2月

嗨@lplenka，

首先，您共享的XML代码中似乎有一个错误:它可以在RapidMiner中加载。也许这段代码是不完整的:

在XML面板中单击，然后按Ctrl + A，按Ctrl + C(复制整个过程)，然后粘贴。

1.要执行python代码，必须使用该函数rm_main在这种情况下，rm_main在entry -中没有参数def rm_main ()-然后定义另一个函数:def pdf_text()。

2.我也看到函数rm_main()返回任何输出:返回........

3.您是否尝试在Notebook中运行您的代码?

问候,

莱昂内尔

lionelderkrikor · 2018年2月

你好,再一次@lplenka，

这只是为了说明，如果您想从.pdf文件中提取文本，可以使用“文本处理”RapidMiner的扩展。

也许你可以使用这个扩展的操作符来执行你想要的。

这里有一个有用的链接:

https://community.www.turtlecreekpls.com/t5/Getting-Started-Knowledge-Base/Keyword-Frequency-in-Text-Mining/ta-p/31618

问候,

莱昂内尔

lionelderkrikor · 2018年2月

嗨@lplenka，

在我的例子中，在对进程运行Execute Python操作符后，output.txt文件为空。

但是，为了完成我的上一篇文章，您可以使用阅读文档和

写文档的操作员文本处理扩展。

过程如下:

<？xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文

<过程扩展= " true " >


< /操作符>


< /操作符>


< /操作符>





> < /过程
< /操作符>
> < /过程

最好的问候,

莱昂内尔

lplenka · 2018年2月

谢谢@lionelderkrikor感谢你的帮助。

将从下次开始使用文本挖掘操作符。

BDW你可以重新启动你的系统，也许我的过程将开始产生完美的结果。这只是我的一个假设。

谢谢你的帮助

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

python的subprocess.run()在Rapidminer中不起作用

最佳答案

答案