令牌运算符问题-帮助请求

amitdamitd 成员,大学教授职位:49Maven
编辑2月3日 帮助
我要处理一些双惊叹号的文件!!当后面跟着一个单词时,应该是一个单独的标记(例如,句子!!)作为一个标志,而不是“句子”和“!!”“分开)。类似地,笑脸字符:)应该是一个单独的令牌。当我使用Tokenize中的非字母模式时,可以提取单词,但不是我想要的方式。当mode =正则表达式与表达式[a-zA-Z!:)]+一起使用时,它根本不起作用。我在表达式构建器中测试了正则表达式,当每个文档文本在其预览中测试时,它工作正常。然而,流程的输出最终是空白的。我完全不知道为什么会这样。我已经附上了两个流程。 Can someone please help?

预期输出为(计数未显示)。
:)(我在冒号和之间加了一个空格)否则编辑器会把它转换成一个像这样的笑脸表情:)
一个
所有
另一个
在这里

最后的


句子
句子! !
句子

然而,


最佳答案

  • amitdamitd 成员,大学教授职位:49Maven
    解决方案接受
    我找到问题所在了。在这里,我们必须使用正则表达式,它是用于分离的标记,而不是我们希望保留的东西。所以正则表达式应该是[.,]+,这样就可以正常工作了。
    BalazsBarany
    登录注册置评。