情绪分析
crimson_crow
成员职位:3.贡献我
在帮助
你好!我是RapidMiner的新成员,我想为我的课程学习情感分析。目的是建立一个模型,可以估计哪些评论是正面的,哪些是负面的。在程序中有一个过程的例子,但我想改变一些事情:
1.用我自己的有更多数据的例子来代替一个例子
2.我想使用一个包含从IMDb站点解析的评论的.xlsx文件,而不是一个只有一条评论的文档。
问题出现在截图“First Problem”中的“Cross Validation”操作符,以及截图“Second Problem”中的“Read Document”操作符。
我无法理解为什么“交叉验证”操作符有类型问题,因为我的数据具有与示例中相同的结构,以及我应该使用什么操作符来正确读取.xlsx文件中的解析数据?
1.用我自己的有更多数据的例子来代替一个例子
2.我想使用一个包含从IMDb站点解析的评论的.xlsx文件,而不是一个只有一条评论的文档。
问题出现在截图“First Problem”中的“Cross Validation”操作符,以及截图“Second Problem”中的“Read Document”操作符。
我无法理解为什么“交叉验证”操作符有类型问题,因为我的数据具有与示例中相同的结构,以及我应该使用什么操作符来正确读取.xlsx文件中的解析数据?
0
最佳答案
-
lionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽嗨@crimson_crow,
感谢您分享您的流程和数据。
你必须:
-在你的训练分支和计分分支中应用相同的预处理步骤,因此放一个标称文本接线员(你不需要阅读文档接线员)在你的分数分支。
—设置来自数据的过程文档在你的评分分支中(比如在你的训练分支中)
-简化你的交叉验证接线员:我只用a支持向量机模型在培训部分和使用应用模型和一个性能(二项分类)在测试部分。
在附件中,工作过程。
问候,
莱昂内尔7
答案