基于文本的数据集上的预测错误。

裹尸布裹尸布 成员职位:2新手
2020年5月编辑 帮助
大家好,我是RapidMiner的新手,我已经被这个问题困了好几个小时了,我需要帮助。
我正在使用来自UCI的电影数据集http://archive.ics.uci.edu/ml/datasets电影
它包含不同的电影数据集,这些电影中的演员和这些电影的导演。主文件是电影数据集。它有电影的名字,类型,拍摄地点,上映日期,导演和制片人。除了date,其他都是文本。

我尝试使用RapidMiner的“Auto Model”来预测电影的类型。基本上我使用的任何模型都会给出一个错误,我得到这样的“输入数据在预处理后没有任何属性。一个原因可能是数据只有未处理的文本列。请检查您的数据和设置。

我在网上搜索了一下,但没有发现这样的错误。

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    在自动模型之前,您是否进行了文本预处理,或者您是否选择了自动模型选项来为您进行文本处理?无论哪种方式,在传统的ML算法能够创建预测之前,它都需要转换成一个词向量。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入数据科学咨询由认证的RapidMiner专家
登录注册置评。