CSV文件在导入到RapidMiner时变得非常大

konmadkonmad 成员职位:1新手
编辑8月7日 帮助
嘿,大家,

我有一个。csv文件,大小为283MB,但是当将文件加载到RapidMiner中时,它大约变成6.7GB,这对于我的系统来说太大了,无法执行文本挖掘。该文件包含3列和约220.000行。其中两列是简单的ID,一列是实际文本,每列大约100个单词。也许你们中的一些人遇到了同样的问题,可以帮助我解决它,或者至少理解这里发生了什么。

提前谢谢大家!

答案

  • ceaperezceaperez 成员职位:343独角兽
    @konmad

    这个问题可能是由编码和元数据引起的。
    您是否尝试过在CSV导入后使用存储操作符,然后使用检索操作符直接从Rapidminer导入数据?

    最好的
    塞萨尔
登录注册置评。