睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

大模型时代,企业将重新定义知识管理

时间:2024-04-07来源:最后派对浏览数:12

知识管理是对企业知识资产进行规范化管理和使用的一种业务流程,是企业发展的基础。

优秀的企业一定非常擅长做知识管理,善于将业务高手脑子里的隐性知识提炼成企业的显性知识,将标杆的成功要素解构出来,提炼成标准化的“套路”,并存进企业的“知识银行”。

大模型与企业知识管理场景之间存在天然的契合度,大模型的核心能力——处理、理解和生成大量数据信息,恰好满足了企业知识管理的需求。大模型技术的不断进步使得知识管理成为企业关注的焦点。当前在探索大模型应用的过程中,很多企业都将知识管理作为了大模型的重点探索场景之一。

知识管理的三个关键能力为知识的获取、检索和分享,大模型对企业知识管理的赋能围绕这三个关键能力展开,使企业能够更加方便地从知识资产中获取最大的价值并促进创新和改善决策制定的过程。

(1)大模型将促进知识获取

知识获取是知识管理的基础,也是知识管理面临的最大挑战。企业内经验丰富的业务专家一般很忙,没有时间坐下来将自己辛苦积累的专业知识形成文档,大模型可以从会议以及其他的对话交互内容中提取知识资产,从而提高知识获取的效率。

通过使用企业现有的显性知识资源,如知识库、企业智库或任何其他形式的内容存储,可以进一步推进知识获取。

检索增强生成(RAG)使用搜索引擎查找和检索企业资源,然后将其作为prompt的一部分传递给大模型,同时附上如何处理这些内容的指令。这样,整个企业的知识资源都可以作为训练大模型的语料。RAG还可以用于保证知识资产的时效性,当有新的、可用的知识资源时,可以通过RAG将其与原始内容重组后一起传递给大模型,以便于大模型进行知识更新。

(2)大模型将优化信息检索准确率

信息检索系统是信息获取的主要手段之一,也是企业对话、问答、推荐系统的重要组成部分。

在企业信息检索系统中使用大模型的一个主要方法是通过上下文学习(ICL)。信息检索系统的四个关键组成部分为查询重写器、检索器、重新排序器和阅读器。大模型与企业信息检索系统的结合如下所示:

• 查询重写器:通过修改用户查询,提高查询精准度和表达能力。传统的重写器通过预定义规则修改查询以更紧密地匹配用户意图。大模型通过大量的文本数据并学习更加微妙的查询和文档表示,充分捕捉用户意图的微妙细微差别,增强查询重写能力。

• 检索器:检索器作为第一遍文档过滤器,收集广泛相关的文档以满足用户查询。大模型在语言理解、文本生成和推理方面展现出的能力将提高检索器的语义能力,识别复杂用户意图。

• 重新排序器:重新排序器是信息检索中的第二遍文档过滤器,旨在基于查询-文档相关性对检索器检索到的文档列表进行重新排序。大模型可以通过整合大规模数据集、为排名提供解释、提高可解释性等方式进行文档重新排序。

• 阅读器:基于文档语料库生成自然语言响应。通过持续向大模型提供文档,最终生成的答案可能比原始检索列表更准确和信息丰富。

大模型还可以通过多种方式提高信息检索系统的容错性。第一,大模型可以比传统方法更准确地检测和诊断故障;第二,大模型可以更快速、高效地从故障中恢复;第三,大模型可以主动防止故障发生。因此,大模型可以提高信息检索系统的可靠性和可用性。

(3)大模型使知识共享变得更加可行

企业大部分的知识都存在于员工的头脑中,如何将这些知识分享出来是企业在组织层面始终面临的挑战。企业知识管理活动的重点一直是获取、存储和检索以文字、数据等形式存在的显性知识,而往往忽视了人与人之间直接或间接的知识共享。

建立和维护帮助员工找到彼此进行知识共享和合作的专业知识目录一直是企业知识管理领域的难题,大模型的出现将改变这一现状。

虽然大模型本身是一个黑匣子,但可以通过提示词的设计引导模型输出,使得大模型具备强大的自然语言处理能力,包括分类、提取、生成和总结,这些能力正是维护专业知识目录所需要的能力。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询