人工智能在合同管理(第4部分:自然语言处理和机器学习)

NLP agsandrew / Adobe股票

在本系列的最后一部分在合同管理的人工智能,我们将注意力转向自然语言处理(NLP)。

本系列在早期的文章中,我提到过聊天机器人和图灵测试,这两个需要NLP。我也提到了机器学习和分类的过程文本的特定领域的本体模型的商业知识。在这一点上,你可能想知道,“是的,但是到底如何我实际模型和提取所有这些知识从我们的现有合同文件呢?”

这是一个很棒的问题,答案是很不容易的,因为你需要解决多语言的语法和语义的问题之前,你要更高级的知识本体。这是NLP进来的地方。数据挖掘所需的外部“大数据”来源和解决遗留合同编码问题。

后者是最大的短期问题,特别是如果你的公司已经通过收购或没有严格建立标准化条款库。但是有合同分析提供者(工具和/或服务),可以根据您的情况。这是一个棘手的问题,因为密度在不同语言编写的“法律”(有多个语义和法律解释),必须分类和挖掘提取原子水平的见解关于义务,权利和利益的风险。这个NLP“自然”的商业语言不能被人类的编码,可伸缩解决基于规则的方法。

这就是机器学习。

机器学习

机器学习是指电脑“学习”从数据流程而不是依靠人类基于规则的过程式编程数据的行动。它不仅发现数据中的模式,还专门帮助相关的各种数据输入和关键数据输出,这有助于使预测分析。

“监督式学习”的方法,人类专家确定输出和系统“学习”如何模仿人类专家,以及揭示潜在的变量和交互,人类就不会发现自己。“无监督学习不依赖于人类直接培训和延伸到深度学习的领域,这超出了本系列的范围。

注意,基于规则的逻辑,更复杂的算法也可以分层的基础上,以帮助改善整体预测分析的有效性。这种整体的方法被证明是在消费领域的分析也类似于遗留合同转换,输入数据的原始合同文本和输出数据分类,抽象和协调合同条款。培训系统还可以用来帮助分类用户的意图在CLM工作流(例如,“指导承包”场景本系列的前面所讨论的)。

总结

没有知识的原始人类智慧是没有意义的。相同的平行与AI-enabled系统应用。组织必须开始看知识管理不是作为文档管理的内部网,而是在人类知识的交叉能力和知识通过AI-enabled计算机仿真系统。

现在在CLM,这个活动可以开始。建立这样一个商业知识基础,然而,只是不能由老一代的CLM支持方法和系统(例如,关系数据库存储合同文档元数据和附件)。能够建立这样一个企业知识库,可以形成AI-enabled商业信息需要高质量的基础合同和高质量的过程,通过他们的生命周期管理这些合同。

因此,CLM主要应用是一个伟大的地方开始构建基于ai CLM奠定基础。我开始这个系列在CLM三个简单的步骤:

  1. 知识库构建一个高层对你所有的合同在合同的形式存储库。
  2. 从合同条款中获得重要情报数据/元数据来识别风险和回报。
  3. 开始利用增强商业情报上游CLM流程内和其他商业通知企业流程

人工智能的应用合同管理是进化。和演化跨越多个世代,包括技术代。作为下一代云CLM提供者运行他们的应用程序的多个企业,他们的系统(“机”,如果你会)也将越来越多地从最终用户。这不仅仅是在一个公司但在成百上千的公司使用一个真正的基于saas解决方案。该系统将学习“大规模”。

外卖吗?糊涂侦探,采购合适的在你开始使用“智能CLM CLM功能。“监督任何学习,开始训练之前机器在任何领域,很高兴得到智能AI的主题来帮助你。最后希望本文已经有用。我鼓励所有采购从业人员不断学习、实践和分享你的结果。我们很想听听你的想法,在这一领域的经验和意见。

在Procurious分享

的声音(5)

  1. Jayant穆克吉:

    嗨,皮埃尔,优秀的文章如何应用于人工智能合同管理。我喜欢你强调了AI系统可以学习如何在基于SaaS的实现“大规模”。我们正在致力于一个原型开发一个基于SaaS的CLM的解决方案来解决复杂的IT服务/外包安排的挑战。将很感激如果你可以检查和给我们反馈当原型已经准备好了。希望能保持联系。最好的问候,Jayant

  2. Nikhil:

    漂亮的一个。CloudMoyo,我们还用毫升& NLP从合同和其他法律文件中提取的见解http://www.cloudmoyo.com/blog-posts/contract-analytics/

  3. 皮埃尔·米切尔:

    后续,我收到答案尤盖下面的问题从我的同事迈克尔博士Lamoureux…。

    “本体的发展依赖于一个复杂的,描述性的模型,定义了域,人际关系,和解释数据的方法,机器学习依赖于数据的数值表示。可以建立在统计机器学习算法、模式识别等知识发现技术。

    虽然机器学习可以使用统计技术对指纹和特征编码来识别可能的实例相关的语义概念,只有真正的语义算法可以提取使用领域模型语义知识。

    CLM的工具,是工作最好的实现中提取语义概念是密封的软件,最近创建的能力为专家用户扩展域模型,以提高检测的准确性和相关性。

    很难说哪个解析器效果最好——所有需要定义相关的本体和训练数据,就像一个神经网络需要训练数据来提高高水平的准确性。换句话说,没有理由,斯坦福大学开源解析器不能工作一样好任何专利/专利的解析器。

    至于这机器学习算法适合词分析,你会最适合混合动力指纹/特征提取技术,封装词距离和使用先进的统计技术(集群、内核机器等)来识别相关的数据点。”

  4. 皮埃尔·米切尔:

    嗨·库马尔,
    据我所知,这是一个结合机器学习(例如,支持向量机来帮助语言翻译成特定条款类型进行分类)和ontology-specific知识建模对于特定的合同领域(例如,期权合约)和更一般的。建立不同的创业公司(和一些球员)工作在这些本体论数据框架作为分析工具。
    我们没有运行的比较基准,但我们看到海豹软件最公司部署,但有工具等其他公司的基拉,Ravn, Recommind (Opentext) eBrevia, LegalRobot, Counselytics等(谁可能会评论这篇博客!)。如果你想看看一个很酷的供应商(网站),看到一个好的总结转储的法律技术,去https://legalese.com/v1.0/page/present
    也看看这个博客ArtificalLawyer——它的优秀。
    谢谢你的写作。

  5. 优:

    本体的发展依赖于描述逻辑在机器学习依赖于统计表示的数据。你能解释合同将提取的语义方面的工具,工作好吗?哪个解析器的最佳精度消歧技术将工作得很好,机器学习算法将诉讼契约词分析?

讨论:

你的电子邮件地址将不会被发表。必填字段标记*

这个网站使用Akismet来减少垃圾邮件。学习如何处理你的评论数据