python的subprocess.run()在Rapidminer中不起作用
朋友们好,我遇到了一些Python的麻烦subprocess.run ()在Execute Python操作符中。我正在使用Xpd阅读器的pdftotext从PDF文件中提取文本。当我运行该进程时,子进程似乎失败了,因为我总是得到一个空白文本文件。
系统细节:-
Windows 10
RapidMiner Studio 8.0
Python 3.6
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
< /操作符>
> < /过程
我找不到错误输出的任何原因。请帮助!
标记:
0
最佳答案
-
lplenka 成员职位:11因素二世
谢谢你的帮助。
对不起,之前的xml文件有一些错误。这是新的xml文件。
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
> < /过程
< /操作符>
> < /过程嗯,是的,当我在笔记本中运行或从cmd调用python脚本时,python脚本工作得很好。
我没有采取任何参数在rm_main(),因为这个脚本不需要任何,我希望文本被提取到“output.txt”在我的开车。所以也没有返回语句。
注意:
令人惊讶的是,我现在在“output.txt”文本文件中得到了提取的文本。我不知道为什么我昨晚没有输出。重启成功了吗?请在您的系统中交叉核对。谢谢你!
0
答案
嗨@lplenka,
首先,您共享的XML代码中似乎有一个错误:它可以在RapidMiner中加载。也许这段代码是不完整的:
在XML面板中单击,然后按Ctrl + A,按Ctrl + C(复制整个过程),然后粘贴。
1.要执行python代码,必须使用该函数rm_main在这种情况下,rm_main在entry -中没有参数def rm_main ()-然后定义另一个函数:def pdf_text()。
2.我也看到函数rm_main()返回任何输出:返回........
3.您是否尝试在Notebook中运行您的代码?
问候,
莱昂内尔
你好,再一次@lplenka,
这只是为了说明,如果您想从.pdf文件中提取文本,可以使用“文本处理”RapidMiner的扩展。
也许你可以使用这个扩展的操作符来执行你想要的。
这里有一个有用的链接:
https://community.www.turtlecreekpls.com/t5/Getting-Started-Knowledge-Base/Keyword-Frequency-in-Text-Mining/ta-p/31618
问候,
莱昂内尔
嗨@lplenka,
在我的例子中,在对进程运行Execute Python操作符后,output.txt文件为空。
但是,为了完成我的上一篇文章,您可以使用阅读文档和
写文档的操作员文本处理扩展。
过程如下:
最好的问候,
莱昂内尔
谢谢@lionelderkrikor感谢你的帮助。
将从下次开始使用文本挖掘操作符。
BDW你可以重新启动你的系统,也许我的过程将开始产生完美的结果。这只是我的一个假设。
谢谢你的帮助