睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

传统企业通过大数据治理、人工智能实现自身转型升级

时间:2021-07-30来源:知乎浏览数:245

近年来人工智能的突然爆发,主要有两个关键因素:一是大数据,为深度学习算法提供海量的训练数据作支撑;二是高性能计算,尤其是通用计算GPU给予了神经网络和深度学习强大的计算力支持,使得以前无法完成的计算或者无法在短时间内完成的计算成为了可能。正因为有了两个关键因素作支撑,使得本轮人工智能呈现与以往不同的特征:在特定领域,学习的主体真正由人变成了机器,人工智能正式进入了2.0时代。

这也是试图寻求借助人工智能实现自身转型升级的传统企业,最为关注的焦点:即如何借助人工智能技术,通过机器自主学习从海量的文本、视频、图像等大数据中每天24小时、永不停息地探寻规则、模式、预测、趋势、关联关系等隐性知识,实现知识创新服务与决策支持,释放“智能红利”,而使公司获得更早的发展先机和更强的竞争力。因此,本文的关注重点并非研究某项具体的人工智能技术,而是探讨如何在传统企业内部建立从大数据到知识的一套工作机制或方法,即行业数据+AI元素,促成AI技术在行业知识转化过程中更好地发挥创新引领作用。

企业大数据包括社交媒体数据、机器对机器数据、大体量交易数据、生物计量学数据和人工生成数据,分为文本、视频、图像、语音等承载形态。大数据到知识的转化可以分为两个阶段:

在大数据深化应用阶段,企业主要由数据科学家、数据分析师等大数据专业人员运用机器学习、探索分析、实时数据服务等大数据深化应用技术,从大数据中提取出规则、趋势、关联关系等各类知识,基于相关的应用方向结合实际需求,构建应用场景,从而产生业务价值;这个阶段的主要特征是以人为学习主体,大数据专业人员全程掌控,基于自身经验去获取所需的各类数据、选择合适的算法、技术、工具平台去发掘隐含在大数据中的隐性知识,完全离不开“人”。

在新一代人工智能应用阶段,由数据科学家、数据分析师等大数据专业人员利用各种深度学习算法,放弃对结果的可解释性、不限定问题假设、不训练样本、也不人工标记数据集,只追求学习的有效性,仅结合人类的先验常识、隐性直觉等知识为引导,基于海量大数据,整体围绕“以机器为学习主体”这一目标,建立注意力模型、记忆网络、迁移学习、强化学习、半监督/无监督学习等算法模型,实现从浅层计算到深度神经推理,“永不停息”自主驱动学习,去发掘隐含在大数据中的隐性知识,最终使机器自身具备数据收集、整理、分析的能力,并自主对算法进行调整和优化,自主将大数据转变为知识,实现高阶人工智能,更好地支撑知识创新服务与各级决策。

数据治理

为了更好地支撑大数据到知识转化过程,应将传统数据治理升级到大数据治理,如同大数据是数据一样,大数据治理本质上也是数据治理,数据治理方法论同样也适用于大数据治理,但是考虑到大数据的特性,需要作出适当的调整,本文重点阐述大数据治理与传统数据治理差异性较大的内容,以及大数据治理对于深化大数据应用、支撑新一代人工智能落地的基石作用。

通过大数据治理,将推动“以人为学习主体”的大数据深化应用阶段逐步向“以机器为学习主体”的新一代人工智能应用阶段转变,推进治理的数据类型由传统的、占比不到15%的结构化数据向原生态格式、多结构、占比超过85%的非结构化数据转变;推进治理的数据范围由专注企业内部数据向行业上下游、跨行业、社会舆情等数据转变;推进数据治理工作目标由体现间接价值向直接推动价值创造转变。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询