在Process Documents操作符中获取每个单独文件的wordlist

b00122599b00122599 成员职位:26因素二世
2020年6月编辑 帮助
嘿,伙计们,

我试图从文本文件中使用下面的XML中的过程来获得文本文件中的顶级单词。然而,我希望在一个文件夹中分别获得每个文本文件的顶部单词,下面的操作给我整个文本文件集合的结果。有没有办法让操作单独处理它们,而不是分组处理?

提前谢谢你,

尼尔。

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
< /操作符>
< /操作符>
<列出关键= " specify_weights " / >
<过程扩展= " true " >
.
.
> < /过程
< /操作符>
.
< /操作符>
< /操作符>
/> .
.
.
.
.
> < /过程
< /操作符>
> < /过程

最佳答案

答案

  • jmphillipsjmphillips 成员职位:18因素二世
    你好,这个可以帮到你。

    ;)
    Rapid.rmp 6.9 k
  • b00122599b00122599 成员职位:26因素二世
    你好,

    很抱歉这么晚才回复,谢谢你的帮助。我现在通过上述过程成功地循环文本文件,但在我的输出列表中的所有文件的单词列表是空的

    再次感谢,

    尼尔。
  • kaymankayman 成员职位:662独角兽
    乍一看,您的流程逻辑似乎没有什么问题,那么如果稍微调整参数(更精确的修剪参数)会怎样呢?
    或者更好的是,先尝试没有任何修剪和绕过过滤器令牌等,以确保您不会在这些步骤中丢失您的内容。如果你知道,你至少知道为什么没有结果。

    另外,作为旁注,如果您只寻找您的单词列表,您可以取消流程文档操作符中的“矢量创建”。你不需要它,所以它会加快一些事情。
  • b00122599b00122599 成员职位:26因素二世
    非常感谢你的努力。现在有一个新问题。我有很多示例集,只是名称为示例集,所以我无法区分哪个结果属于哪个文本文件。您是否恰好有如何将文本文件名添加到输出而不是示例集的任何指针?再次感谢。

    尼尔。
  • b00122599b00122599 成员职位:26因素二世
    再次感谢所有的帮助,非常感激!
    kayman
登录注册置评。