如何循环通过图片文本识别

tngotngo 成员职位:3.学我
2020年6月编辑 帮助
大家好!

我是快速矿工的新手,如果你能提供任何帮助,我会很感激。我有一个数据库的url字段。所有的url都是图片。我需要找到一个过程,无需手动单击URL,我仍然可以从我的数据集中的每一行的URL图像中提取文本。我的数据集有数十万行。

答案

  • kaymankayman 成员职位:662独角兽
    由于rapidminer没有开箱即用的“img to text”操作符,您将需要在这里使用python扩展。

    一个可能的工作流程是使用RM循环所有的db记录-> webmining扩展下载图像并存储在本地-> python使用例如opencv读取图像-> pytesseract做OCR获取文本->返回文本到Rapidminer并继续下一个图像。


    tngo
  • rdesairdesai 员工,rmresearch,成员职位:11RM研究
    在具有新功能的深度学习扩展中,您可以轻松地使用“从图像中提取文本”,因为该操作符使用Tesseract OCR库。如果你有多个图像,那么你可以通过在进程中添加另一个称为“读取图像元数据”的操作符来循环图像。
    David_A kayman
  • tngotngo 成员职位:3.学我
    @kayman
    嗨,Kayman,谢谢你的帮助!你能更详细地说明如何下载图像吗?我使用操作符获取页面,我没有看到从url下载图像的任何选项
  • tngotngo 成员职位:3.学我
    @rdesai非常感谢!我试过你的方法,很有效。但是,我需要能够从数据库中的url自动下载所有图像到我自己的文件夹中,或者我需要一种替代方法来运行这个,而不需要将图像下载到文件夹中。你有什么想法吗?
  • kaymankayman 成员职位:662独角兽
    您可以使用[open file]操作符,该操作符允许您根据url选择文件。如果你把它和[写文件]操作符结合起来,你可以把它保存在你的磁盘上。您可能需要对宏做一些调整来定义文件名和文件夹,但本质上这应该可以工作。
  • kaymankayman 成员职位:662独角兽
    @rdesai哦,哇,我还不知道这个
登录注册置评。