python的subprocess.run()在Rapidminer中不起作用

lplenkalplenka 成员职位:11因素二世
2019年6月编辑 帮助

朋友们好,我遇到了一些Python的麻烦subprocess.run ()在Execute Python操作符中。我正在使用Xpd阅读器的pdftotext从PDF文件中提取文本。当我运行该进程时,子进程似乎失败了,因为我总是得到一个空白文本文件。

系统细节:-

Windows 10

RapidMiner Studio 8.0

Python 3.6

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>


< /操作符>
> < /过程

我找不到错误输出的任何原因。请帮助!

标记:

最佳答案

  • lplenkalplenka 成员职位:11因素二世
    解决方案接受

    @lionelderkrikor

    谢谢你的帮助。

    对不起,之前的xml文件有一些错误。这是新的xml文件。

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文







    <过程扩展= " true " >


    < /操作符>


    > < /过程
    < /操作符>
    > < /过程

    嗯,是的,当我在笔记本中运行或从cmd调用python脚本时,python脚本工作得很好。

    我没有采取任何参数在rm_main(),因为这个脚本不需要任何,我希望文本被提取到“output.txt”在我的D:开车。所以也没有返回语句。

    注意:

    令人惊讶的是,我现在在“output.txt”文本文件中得到了提取的文本。我不知道为什么我昨晚没有输出。重启成功了吗?请在您的系统中交叉核对。谢谢你!:)

    rm1.xml 1.9 k

答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽

    @lplenka

    首先,您共享的XML代码中似乎有一个错误:它可以在RapidMiner中加载。也许这段代码是不完整的:

    在XML面板中单击,然后按Ctrl + A,按Ctrl + C(复制整个过程),然后粘贴。

    1.要执行python代码,必须使用该函数rm_main在这种情况下,rm_main在entry -中没有参数def rm_main ()-然后定义另一个函数:def pdf_text()。

    2.我也看到函数rm_main()返回任何输出:返回........

    3.您是否尝试在Notebook中运行您的代码?

    问候,

    莱昂内尔

    lplenka
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽

    你好,再一次@lplenka

    这只是为了说明,如果您想从.pdf文件中提取文本,可以使用“文本处理”RapidMiner的扩展。

    也许你可以使用这个扩展的操作符来执行你想要的。

    这里有一个有用的链接:

    https://community.www.turtlecreekpls.com/t5/Getting-Started-Knowledge-Base/Keyword-Frequency-in-Text-Mining/ta-p/31618

    问候,

    莱昂内尔

    lplenka
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽

    @lplenka

    在我的例子中,在对进程运行Execute Python操作符后,output.txt文件为空。

    但是,为了完成我的上一篇文章,您可以使用阅读文档

    写文档的操作员文本处理扩展。

    过程如下:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.0.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>


    < /操作符>


    < /操作符>





    > < /过程
    < /操作符>
    > < /过程

    最好的问候,

    莱昂内尔

    sgenzer
  • lplenkalplenka 成员职位:11因素二世

    谢谢@lionelderkrikor感谢你的帮助。

    将从下次开始使用文本挖掘操作符。

    BDW你可以重新启动你的系统,也许我的过程将开始产生完美的结果。这只是我的一个假设。

    谢谢你的帮助:)

    sgenzer
登录注册置评。