登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册即可开始。
用RapidMiner登录
用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.3 k
所有类别
19.3 k
帮助
442
知识库
RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
用正则表达式过滤停止词
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:星期一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问问题
寻找有用的视频
首页
;
帮助
用正则表达式过滤停止词
Anna_May1
成员
职位:
14
学我
2020年12月
在
帮助
嗨,伙计们,
我目前正在与Knn一起在Rapidminer中进行情感分析。我想计算删除停止词时文档中剩下的字数。在“从数据操作符处理文档”中使用“Filter stopwords”操作符只有在我标记数据并首先使用“Nominal to Text”操作符时才有效。这里的问题是输出结果如下图所示。我想能够计数删除停止词后留下的单词,所以我想知道是否有一个正则表达式,可以在“替换”操作符内使用,只删除停止词而不标记它。
干杯!
标记:
正则表达式
情绪分析
ETL +数据准备
0
答案
jacobcybulski
委员,大学教授
职位:
391
独角兽
2020年12月
@Anna_May1
由于你没有附上图片,我无法看到图片。然而,在标记文本之后,处理停顿词或数单词会容易得多。例如,您可以有两个文本处理流,一个带有and,一个没有停顿词,然后您可以为两者计算标记并找到差异。事实上,当您的文本表示是根据频率时,计数非常简单——在列中添加这些频率。
0
登录
或
注册
置评。
答案