导入两个pdf文件,并找到相似性和差异

NadiaaaaNadiaaaa 成员职位:1新手
嗨,快速矿工社区,我是这里的新手。我正在努力解决一个非常复杂的问题。基本上,我有两个pdf文件是关于“制作手套所需的要求”,按照美国和欧洲的风格。那么,我是否可以将这两个pdf文件导入到rapidminer中,并根据它们的需求找到相似点和不同点呢?这里的相似性不仅意味着他们有相同的词,他们可能提到不同的词,但他们有相同的意思。

答案

  • kaymankayman 成员职位:662独角兽
    读取文档(文本扩展的一部分)允许您将pdf作为文本阅读,因此可以轻松地以这种方式覆盖导入部分。也有寻找相似度的选项,但不太确定如果你只有2个文档,它们是否有用。
登录注册置评。