灭绝事件:亚马逊精华刚刚扼杀了光学字符识别(OCR)行业。谁是下一个,谁是安全的?

中断 freshidea / Adobe股票

Spend Matters欢迎商业自动化专家Doug Hudgeon的这篇客座文章。

一年一度的亚马逊AWS Re:Invent大会刚刚结束。大会上最有趣的声明并不是高调改变他们的无服务器和机器学习平台。最有趣的公告是一个三分钟的视频这是亚马逊推出的一项新的OCR(光学字符识别)服务。这项服务从文件中提取文本和表格,每1 000页收费1.50美元。

亚马逊文本OCR服务之所以有趣,有三个原因,每一个原因本身都值得一篇文章,但我们在这里简单地看看这三个以及受到影响的行业:

  • 提取物扼杀了光学字符识别(OCR)行业。
  • 这项服务突显了大型云服务提供商的发展方向,以及谁将成为下一个被淘汰的对象。
  • 这表明,大型云服务提供商可以通过使用机器学习,而不是收购初创企业或老牌企业,来主宰一个新行业。

3兴趣领域

提取物扼杀了光学字符识别(OCR)行业

OCR行业之所以存在,是因为公司会收到重复的文档,如发票、报表和合同,它们需要从中提取数据。既然Amazon已经进入了这个市场,那么如果您从事文档数据提取业务,那么您的业务现在已经死亡。亚马逊刚刚将进入门槛降低到几乎为零。你很快就会有数千家竞争者,而不是25家。而且,现在任何人都可以以非常低的价格获得您为从文档中提取数据而构建的许多IP。

AWS之所以能够如此果断地进入OCR业务,是因为OCR是一个可以通过应用单一机器学习方法来解决的问题。让我们更详细地看一下。

重复业务文档中的大部分数据,如发票、报表和索赔表单,都属于以下两种类型:

  • 头级数据——在文档中只出现一次的数据,如发票号或索赔号
  • 表数据——在文档中多次出现的数据,如发票或报表中的行。

下面的截图显示了Textract从文档中获取标题和表格数据:

通过机器学习模型的正确组合,云提供商可以构建一个综合的解决方案,处理这两种类型的数据。一旦他们建成了它,他们就有了允许任何人使用它的基础设施,而成本只是当前玩家的一小部分。

如果你从事的是这种类型的行业,你的业务就毫无价值。

对其他行业的影响

在明年的AWS Re:Invent大会上,其他行业将面临灭绝。两个明显的竞争者是数据/支出分析和机器人过程自动化(RPA)。

数据分析公司(支出分析公司是其中的一个子集)从多个来源获取数据,并将其与其他来源的数据以不同的聚合级别链接在一起。这个任务很复杂,但它仍然是机器学习可以解决的任务类型。AWS的QuickSight产品已经开始走上这条道路。目前它还很初级,但很快就会变得更好——可能会赶上《Re:Invent 2019》。

RPA公司与分析公司属于同一类别。当您去掉AWS、谷歌和Microsoft已经构建的RPA软件的部分(如机器学习、工作流和编排)时,您只剩下一个计算机视觉问题:如何识别按哪个按钮或输入数据到哪个字段?RPA是一个热门市场,如果云计算供应商不尝试解决这个问题,我会感到震惊。

如果你在这些行业,现在就卖。

对初创企业

亚马逊文本的一个更广泛的影响(但很容易被忽视)是,它对初创企业意味着什么。绝大多数初创企业都是通过收购退出的。这意味着,初创企业不是通过在证券交易所上市或建立大型私营企业而成为上市公司,而是被更大的公司收购。

在OCR领域,这是一个久经考验的退出策略:2015年,CoupaXero在2018年以7000万美元的价格收购了Hubdoc。

但Textract的服务表明,可以通过机器学习解决问题的大型云服务提供商并不需要收购一家初创企业或一家现有企业来占据主导地位。机器学习就像一把瑞士军刀——同样的工具集可以用来解决不同的问题。所以,一旦他们有了工具和数据,他们就不需要购买初创企业了。

如果你经营一家初创企业,确保你的退出策略仍然适用于一个使用瑞士军刀的世界。

谁是安全的呢?

到目前为止,我们已经研究了面临风险的业务类型(OCR、分析和RPA)。但谁是安全的吗?

有三种类型的企业是安全的:

  1. 这些公司雄心勃勃,希望成为AWS、谷歌和微软的有力竞争对手。我们不会讨论任何细节,只会注意到AWS、谷歌和微软最终会消亡,就像罗马帝国一样,尽管看起来不可战胜,最终还是会消亡。
  2. 将云服务提供商提供的工具整合到自己的产品和服务中的公司。
  • 当OCR公司陷入困境时,提供应付账款解决方案的公司将兴旺发达,因为他们可以以低得多的成本向客户提供解决方案。
  • 虽然数据分析公司陷入了困境,但帮助客户理解数据的公司将蓬勃发展,因为他们的客户将获得更多数据,并需要帮助将见解应用到业务中。
  • 虽然RPA公司陷入困境,但为客户提供有效自动化建议和服务的公司将兴旺发达,因为获得正确的自动化解决方案组合需要为每个客户提供不同的方法。
  1. 公司的功能很难分解和/或广泛的网络。

从采购到付款的公司受到了合理的保护,不受大型云提供商的干扰,因为它们解决的问题主要是组织性的。

例如,如今,一家公司可以从亚马逊(Amazon)(或团购网站)购买几乎所有它需要的东西,但大多数公司都没有,因为他们重视选择、自决等。这不仅仅是一个机器学习问题。亚马逊要想解决这个问题,就需要改变公司的经营方式。这需要时间。

道格·哈金(Doug Hudgeon)是曼宁出版社(Manning Publications)一本新书的作者《商业机器学习》使用Amazon SageMaker构建和部署机器学习应用程序的动手指南。

doug@mybusinessautomated.com

在Procurious分享

讨论:

您的电子邮件地址将不会被公布。必填字段已标记

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据