看起来你是新来的。登录或注册开始。
http://www.cs.cmu.edu/~enron/
所有的文本挖掘者——这是经典的数据集。这些数据最初是公开发布到网络上,由…联邦能源管理委员会在调查期间。
办公室里一些自以为是的年轻人最近问我安然公司是谁——哦,时间过得真快。
你建议如何读取这个数据集?我已经玩了好几年了,从2015年起它就放在我的档案里了。
我遇到的问题是,可以用来定义字段的每个标记都存在于文本中。例如,“To:”字段将是希望从数据中提取的字段之一,但是该字段也出现在邮件正文中。
答案
你建议如何读取这个数据集?我已经玩了好几年了,从2015年起它就放在我的档案里了。
我遇到的问题是,可以用来定义字段的每个标记都存在于文本中。例如,“To:”字段将是希望从数据中提取的字段之一,但是该字段也出现在邮件正文中。