在流程中从图像里提取文本

您可以在流程中使用光学字符识别 (OCR) 技术从图像中提取文本,并将该文本保存在单独的字段中。您可以在知识库中搜索该文本。

有关如何将此功能与从流程中填充知识搜索集合的功能相结合,从而提供 Ivanti SnapIT 功能的信息,请参阅知识管理指南。Ivanti SnapIT 功能使用户能够提供错误消息的图像,并自动返回知识数据库中找到的、针对该错误的最佳解决方案。

设置 OCR 行为

所使用的 OCR 技术 (Abbyy) 托管在云中,您的组织需要在 abbyy.com 订阅并注册帐户才能使用它。然后,您需要在 Abbyy 网站上针对 Service Desk 或 Asset Manager 创建应用程序,以使用这些凭据并将其添加到控制台中的系统设置。

有关设置 OCR 系统设置的信息,请参阅OCR Api 设置

当您配置了 OCR 系统设置时,您可以设置对象和属性,它们将用于保存图像及其提取的文本。

要设置 OCR 行为:

  1. 对象设计器中,打开要从中使用 OCR 功能的对象。
    例如,事件管理\事件。
  2. 单击属性树顶部的对象名称,然后在属性网格中的行为旁边单击 省略号图标
    出现“行为选择”对话框。
  3. 可用项目列表中,选择 OCR,然后单击 右箭头
    OCR 将移动到已选择的项目列表。
  4. 单击确定并保存更改。
    随即会向对象添加一个名为 OCR 状态的新属性。该属性用于记录 OCR 请求是否已处理。0 = 没有,1 = 已成功,2 = 已失败。
    同样的,还会创建一个名为提取文本的新操作,您可以在流程设计器中使用该操作。

当您创建了具有 OCR 行为的对象之后,您可以配置属性来保存图像及其提取的文本。

  1. 向对象添加一个属性并将属性的数据类型设置为附件
    例如,OCR 附件

确保将附件类型属性设置为

  1. 将属性的是否启用文本提取?属性设置为并保存更改。
    随即会向对象添加一个名为来自属性标题的文本的新属性。
    例如,来自 OCR 附件的文本。这就是将保存从图像中所提取的文本的属性。

您可以使用流程设计器中的业务对象树来更改提取文本操作的文本(并添加多语版本)。有关操作的详细信息,请参阅流程操作。有关创建多语言从系统的详细信息,请参阅设计多语言系统

您可以将是否启用文本提取? 属性添加到同一对象的多个附件属性。在该实例中,每个属性都将包含各自的文本,来自...在这种情况下,每个属性都有其自己的来自...的文本属性,但将使用相同的提取文本操作。

使用提取文本操作

当您将 OCR 行为添加到对象并将附件属性的是否启用文本提取?属性设置为之后,那么对于基于该对象的流程,流程设计器中就会提供提取文本操作。您可以对操作实例自动操作实例或是可选操作实例使用该操作。该操作会从所有存在有附件属性的是否启用文本提取?属性设置为的附件属性中的图像内提取文本,然后将提取出的文本保存在相应的来自属性标题的文本属性中。

有关使用流程设计器的信息,请参阅流程设计器

流程中的提取文本自动操作

OCR Web 服务会将图像当作包含当前用户应用程序界面语言的文本来进行处理。例如,如果用户的区域与语言设置为日语,则图像将被当作包含日语文本进行处理。有关如何确定应用程序界面语言的信息,请参阅设计多语言系统

有关使用此功能从图像中搜索知识的信息,请参阅SnapIT:自动搜索从图像提取的文本