安然电子邮件数据集

stevefarrstevefarr 成员职位:93Maven
2018年11月编辑 知识库

http://www.cs.cmu.edu/~enron/

所有的文本挖掘者——这是经典的数据集。这些数据最初是公开发布到网络上,由…联邦能源管理委员会在调查期间。

办公室里一些自以为是的年轻人最近问我安然公司是谁——哦,时间过得真快。

标记:

答案

  • 罗宾罗宾 成员职位:One hundred.大师

    你建议如何读取这个数据集?我已经玩了好几年了,从2015年起它就放在我的档案里了。

    我遇到的问题是,可以用来定义字段的每个标记都存在于文本中。例如,“To:”字段将是希望从数据中提取的字段之一,但是该字段也出现在邮件正文中。

登录注册置评。