文本挖掘从文本中提取数据

Raphael2304Raphael2304 成员职位:4新手
亲爱的所有,
我有一个小问题,关于文本挖掘与快速矿工。我有一堆新闻稿,结构都一样。现在我想提取新闻稿的标题(第一行),发布日期(第二行)以及新闻稿的彩色部分与发现彩色部分的整个段落相同。所有的发行版都在一个.rtf文件中,并用分段分隔开。有什么最快的方法吗?

提前感谢!

最好的
拉斐尔

最佳答案

  • kaymankayman 成员职位:662独角兽
    解决方案接受
    使用split和一些正则表达式的组合来查看换行符应该可以达到这个目的。

    附带一个非常粗略的示例,可以让您开始。

答案

登录注册置评。