随着数据要素市场化配置的进程不断加速,数据的价值正以前所未有的速度被社会各界广泛认可和深入挖掘。人们对于数据相关概念的精确定义需求愈发迫切。为推动凝聚共识,国家数据局、工信部等国家部委,对数据领域相关名词进行了官方的解释和界定。本文将汇集整理这些宝贵的官方资源,为大家呈现一份清晰、准确的数据领域名词手册,助力大家更好地把握数据时代的脉搏。

01国家数据局:数据领域名词解释
2024年12月30日,国家数据局就数据领域常用名词发布官方释义。对数据、原始数据、数据资源、数据要素据产品和服务、数据资产等40个数据领域名词给出了解析:
01数据
指任何以电子或其他方式对信息的记录。数据在不同视角下被称为原始数据、衍生数据、数据资源、数据产品和服务、数据资产、数据要素等。
02原始数据
指初次产生或源头收集的、未经加工处理的数据。
03数据资源
指具有价值创造潜力的数据的总称,通常指以电子化形式记录和保存、可机器读取、可供社会化再利用的数据集合。
04数据要素
指投入到生产经营活动、参与价值创造的数据资源。
05数据产品和服务
指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。
06数据资产
指特定主体合法拥有或者控制的,能进行货币计量的,且能带来经济利益或社会效益的数据资源。
07数据要素市场化配置
指通过市场机制来配置数据这一新型生产要素,旨在建立一个更加开放、安全和高效的数据流通环境,不断释放数据要素价值。
08数据处理
包括数据的收集、存储、使用、加工、传输、提供、公开等。
09数据处理者
指在数据处理活动中自主决定处理目的和处理方式的个人或者组织。
10受托数据处理者
指接受他人委托处理数据的个人或者组织。
11数据流通
指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。
12数据交易
指数据供方和需方之间进行的,以特定形态数据为标的,以货币或者其他等价物作为对价的交易行为。
13
数据治理
指提升数据的质量、安全、合规性,推动数据有效利用的过程,包含组织数据治理、行业数据治理、社会数据治理等。14.数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。
14数据安全
指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。
15公共数据
指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。
16数字产业化
指移动通信、人工智能等数字技术向数字产品、数字服务转化,数据向资源、要素转化,形成数字新产业、新业态、新模式的过程。
17产业数字化
指传统的农业、工业、服务业等产业通过应用数字技术、采集融合数据、挖掘数据资源价值,提升业务运行效率,降低生产经营成本,进而重构思维认知,整体性重塑组织管理模式,系统性变革生产运营流程,不断提升全要素生产率的过程。
18数字经济高质量发展
指围绕加快培育新质生产力,以数据要素市场化配置改革为主线,通过协同完善数据基础制度和数字基础设施、全面推进数字技术和实体经济深度融合、持续提升数字经济治理能力和国际合作水平,实现做强做优做大目标的数字经济发展新阶段。
19数字消费
指数字技术、应用支撑形成的消费活动和消费方式,既包括对数智化技术、产品和服务的消费,也包括消费内容、消费渠道、消费环境的数字化与智能化,还包括线上线下深度融合的消费新模式。
20产业互联网
指利用数字技术、数据要素推动全产业链数据融通,赋能产业数字化、网络化、智能化发展,推动业务流程、组织架构、生产方式等重组变革,实现产业链上下游协同转型、线上线下融合发展、全产业降本增效与高质量发展,进而形成新的产业协作、资源配置和价值创造体系。
21城市全域
数字化转型
指城市以全面深化数据融通和开发利用为主线,综合利用数字技术和制度创新工具,实现技术架构重塑、城市管理流程变革和产城深度融合,促进数字化转型全领域增效、支撑能力全方位增强、转型生态全过程优化的城市高质量发展新模式。
22“东数西算”工程
是把东部地区经济活动产生的数据和需求放到西部地区计算和处理,对数据中心在布局、网络、电力、能耗、算力、数据等方面进行统筹规划的重大工程,比如人工智能模型训练推理、机器学习等业务场景,可以通过“东数西算”的方式让东部业务向西部风光水电丰富的区域迁移,实现东西部协同发展。加快推动“东数西算”工程建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展。
23高速数据网
指面向数据流通利用场景,依托网络虚拟化、软件定义网络(SDN)等技术,提供弹性带宽、安全可靠、传输高效的数据传输服务。
24全国一体化算力网
指以信息网络技术为载体,促进全国范围内各类算力资源高比例、大规模一体化调度运营的数字基础设施。作为“东数西算”工程的2.0版本,具有集约化、一体化、协同化、价值化四个典型特征。
25元数据
是定义和描述特定数据的数据,它提供了关于数据的结构、特征和关系的信息,有助于组织、查找、理解、管理数据。
26结构化数据
指一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的,并且可以使用关系模型予以有效描述。
27半结构化数据
指不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层的一种数据化结构形式。
28非结构化数据
指不具有预定义模型或未以预定义方式组织的数据。
29
数据分析
指通过特定的技术和方法,对数据进行整理、研究、推理和概括总结,从数据中提取有用信息、发现规律、形成结论的过程。
30数据挖掘
是数据分析的一种手段,是通过统计分析、机器学习、模式识别、专家系统等技术,挖掘出隐藏在数据中的信息或者价值的过程。
31
数据可视化
指通过统计图表、图形、地图等图形化手段,将数据中包含的有用信息清晰有效地传达出来,以便于数据使用者更好地理解和分析数据。
32
数据仓库
指在数据准备之后用于永久性存储数据的数据库。
33数据湖
指一种高度可扩展的
数据存储架构,它专门用于存储大量原始数据和衍生数据,这些数据可以来自各种来源并以不同的格式存在,包括结构化、半结构化和非结构化数据。
34湖仓一体
指一种新型的开放式的存储架构,打通了数据仓库和数据湖,将数据仓库的高性能及管理能力与数据湖的灵活性融合起来,底层支持多种数据类型并存,能实现数据间的相互共享,上层可以通过统一封装的接口进行访问,可同时支持实时查询和分析。
35隐私保护计算
指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私保护计算的常用技术方案有安全多方计算、联邦学习、可信执行环境、密态计算等。常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。
36安全多方计算
指在一个分布式网络中,多个参与实体各自持有秘密数据,各方希望以这些数据为输入共同完成对某函数的计算,而要求每个参与实体除计算结果、预期可公开的信息外均不能得到其他参与实体的任何输入信息。主要研究针对无可信第三方情况下,安全地进行多方协同的计算问题。
37联邦学习
指一种多个参与方在保证各自原始私有数据不出数据方定义的可信域的前提下,以保护隐私数据的方式交换中间计算结果,从而协作完成某项机器学习任务的模式。
38可信执行环境
指基于硬件级隔离及安全启动机制,为确保安全敏感应用相关数据和代码的机密性、完整性、真实性和不可否认性目标构建的一种软件运行环境。
39密态计算
指通过综合利用密码学、可信硬件和系统安全相关技术,实现计算过程数据可用不可见,计算结果能够保持密态化,以支持构建复杂组合计算,实现计算全链路保障,防止数据泄漏和滥用。
40区块链
是分布式网络、加密技术、智能合约等多种技术集成的新型
数据库软件,具有多中心化、共识可信、不可篡改、可追溯等特性,主要用于解决数据流通过程中的信任和安全问题。
02国家数据局:数据基础设施术语
2025年1月6日,国家数据局发布了《国家数据基础设施建设指引》,《指引》针对国家数据基础设施、隐私保护计算、区块链、数据使用控制、可信数据空间、数场、数联网、数据元件、数据安全技术等技术术语作了官方释义。
01国家数据基础设施
国家数据基础设施是从数据要素价值释放的角度出发,面向社会提供
数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。

国家数据基础设施总体架构图
02隐私保护计算
隐私保护计算指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私保护计算的常用技术方案有安全多方计算、联邦学习、可信执行环境、密态计算等;常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。
03区块链
区块链是分布式网络、加密技术、智能合约等多种技术集成的新型数据库软件,具有多中心化、共识可信、不可篡改、可追溯等特性,主要用于解决数据流通过程中的信任和安全问题。
04数据使用控制
数据使用控制是指在数据的传输、存储、使用和销毁环节采用技术手段进行控制,如通过智能合约技术,将数据权益主体的数据使用控制意愿转化为可机读处理的智能合约条款,解决数据可控的前置性问题,实现对数据资产使用的时间、地点、主体、行为和客体等因素的控制。
05可信数据空间
可信数据空间是指数据资源开放互联、可信流通的一类数据流通利用设施,其以数据使用控制为核心,以连接器为技术载体,以实现数据可信交付,保障数据流通中“可用不可见”“可控可计量”为目标,具备数据可信管控、资源交互、价值创造三大核心能力。

可信数据空间架构图
06数场
数场是依托开放性网络及算力和隐私保护计算、区块链等各类关联功能设施,面向数据要素提供线上线下资源登记、供需匹配、交易流通、开发利用、存证溯源等功能,支持多场景应用的一种综合性数据流通利用设施。以高效流通、价值释放、繁荣生态为核心,实现数据可见、可达、可用、可控、可追溯,具备开放性、融合性、扩展性等特点。
数场从点、线、面、场、安全五个维度构建标准化技术框架。点是数据主体进入数场的接入点。线是数场内连接各主体、各平台的数据高速传输网,实现数场内各主体之间的互联互通。面是数场中数据主体、传输网络的集合,是实现数据大规模流通、高效安全利用的核心。由点到线、由线到面构成数场基础设施。场是基于数场基础设施构建的数据应用、场景化创新,以及相关能力、流程、规范的统称。安全是覆盖点、线、面、场的动态全流程保护措施。数场在技术架构上包括接入点、功能平台、管理平台、安全保障、网络传输等基础服务平台。

数场功能架构图
07数联网
数联网由数据流通接入终端、数据流通网络、数据流通服务平台构成,提供一点接入、广泛连接、标准交付、安全可信、合规监管、开放兼容的数据流通服务。

数联网功能架构图
08数据元件
数据元件提供统一标准、自主可控、安全可靠、全程监管的数据存储和加工服务,支持采用标准化工序完成数据产品规模化加工、生产和再利用,适用于大规模数据加工和生产场景。数据元件作为连接数据供需两端的“中间态”,将原始数据与数据应用“解耦”,基于数据元件相关组件,实现从数据归集到数据元件加工交易全生命周期的数据要素开发和管控。
09数据安全技术
数据安全技术为数据收集、存储、处理、传输、共享和销毁等全生命周期提供安全保障,包括数据备份与恢复、应用数据加密、数据泄露检测、流转监测、身份认证与访问控制、数据脱敏、数据水印、数据安全态势感知等。
03国家发改委:数据要素相关名词
2024年全国两会期间,《2023年国民经济和社会发展计划执行情况与2024年国民经济和社会发展计划草案》明确定义了将在未来影响我国经济与社会发展的关键词及其内涵诠释,从而为规划我国经济蓝图和社会发展方向提供了有力指导和依据,其中包括9个数据要素相关的名词。
01全国统一大市场
全国统一大市场是指在全国层面强化市场基础制度规则统一、推进市场设施高标准联通、打造统一的要素和资源市场、推进商品和服务市场高水平统一、推进市场监管公平统一以及进一步规范不当市场竞争和市场干预行为,打破地方保护和市场分割,打通制约经济循环的关键堵点,破除各种封闭小市场、自我小循环,促进商品要素资源在更大范围内畅通流动,进而形成高效规范、公平竞争、充分开放的强大市场。
02新型基础设施
新型基础设施是以信息网络为基础,以技术创新为驱动,提供数字转型、智能升级、融合创新等方面的基础性、公共性服务,其内涵随着新技术的成熟应用而不断拓展。当前主要包括三类:
一是信息基础设施。主要是指基于新一代信息技术演化生成的基础设施,包括5G网络、数据中心等基础设施。
二是融合基础设施。主要是指深度应用信息技术,促进传统基础设施转型升级,进而形成的基础设施新形态,包括智能交通物流设施等。
三是创新基础设施。主要是指支撑科学研究、技术开发、产品及服务研制的基础设施,包括科学研究设施等。
03公共数据资源开发利用
公共数据资源开发利用是指对公共机构依法履职或提供公共服务过程中产生的数据进行加工处理再利用的过程。主要包括政务数据共享、公共数据开放、公共数据授权运营三种方式。
04新质生产力
新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生,以劳动者、劳动资料、劳动对象及其优化组合的跃升为基本内涵,以全要素生产率大幅提升为核心标志,特点是创新,关键在质优,本质是先进生产力。绿色发展是高质量发展的底色,新质生产力本身就是绿色生产力。
05“人工智能+”行动
“人工智能+”行动推动人工智能技术与经济社会各领域深度融合,支撑各行业应用创新,赋能百业智能化转型升级,提高生产效率,激发创新活力,重塑产业生态,培育经济发展新动能,形成更广泛的以人工智能为创新要素的经济社会发展新形态。
06“数据要素X”行动
“数据要素×”行动是指聚焦重点行业和领域,推动数据要素与劳动力、资本、技术等要素协同,促进数据多场景应用、多主体复用,加快多元数据融合,提高全要素生产率,开辟经济增长新空间,培育经济发展新动能。
04中共中央:数智技术名词解释
2024年7月第二十届中央委员会第三次全体会议通过《中共中央关于进一步全面深化改革推进中国式现代化的决定》,在《党的二十届三中全会<决定>学习辅导百问》中,对以下名词做出了权威解释:
01未来产业
未来产业是由前沿技术驱动,当前处于孕育萌发阶段或产业化初期,具有显著战略性、引领性、颠覆性和不确定性的前瞻性新兴产业。未来产业代表着新一轮科技革命和产业变革方向,是经济增长的最活跃力量,有望培育发展成先导性支柱产业,是形成新质生产力的重要阵地。世界主要国家都在抓紧布局,发展未来产业,抢占发展制高点。我国重点围绕未来制造、未来信息、未来材料、未来能源、未来空间和未来健康等方向,大力发展人工智能、类脑智能、量子科技、原子级制造、生物制造、人形机器人、低空经济、氢能等未来产业,这是牢牢把握未来发展主动权的战略选择。
02数智技术
数智技术是数字化和智能化的有机融合,可以理解为“数字化+智能化”,是在数字化基础上融合应用机器学习、人工智能等智能技术的过程。数智化是新型工业化的鲜明特征,是形成新质生产力的重要途径。通过“人工智能+工业制造”、“人工智能+生成设计”等推进智能工厂、未来工厂、“灯塔工厂”建设,推动实现制造业数智化,是制造业转型升级的重要方向。
03生成式人工智能
生成式人工智能是人工智能的一个分支,是基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。这种技术能够针对用户需求,依托事先训练好的多模态基础大模型等,利用用户输入的相关资料,生成具有一定逻辑性和连贯性的内容。与传统人工智能不同,生成式人工智能不仅能够对输入数据进行处理,更能学习和模拟事物内在规律,自主创造出新的内容。
05工信部等:数据领域名词解释
2024年8月,由工业和信息化部等十一部门联合发布的《关于推动新型信息基础设施协调发展有关事项的通知》中,对新型信息基础设施等9个名词做出了官方解释:
01新型信息基础设施
新型信息基础设施主要包括5G网络、光纤宽带网络、 骨干网络、国际通信网络、卫星互联网等网络基础设施,数 据中心、通用算力中心、智能计算中心、超算中心等算力基 础设施,人工智能、区块链、量子计算等新技术设施。随着 新通用技术的产生和推广应用,新型信息基础设施形态会更加丰富多样。
02智算中心
智算中心,即人工智能计算中心,是基于人工智能理论, 采用人工智能计算架构,提供人工智能应用所需算力服务、 数据服务和算法服务的一类算力基础设施。
03超算中心
超算中心,即超算数据中心,是基于超级计算机或者是大规模的计算集群的数据中心,能够提供大规模计算、存储 和网络服务等功能,广泛应用于航天、国防、石油勘探、气候建模和基因组测序等应用场景。
04边缘数据中心
边缘数据中心是一种新型的数据中心形式,位于网络边缘,介于用户端和集中式云数据中心之间,旨在减少数据传输距离和时间,提高数据处理速度和效率,具有规模小、部署位置灵活、计算和存储能力本地化等特点。
05新技术基础设施
新技术基础设施是基于新技术形成的基础设施形态的统称,现阶段包括人工智能、区块链、量子信息等设施。
06人工智能基础设施
人工智能基础设施是人工智能技术推广普及过程中形成的一类新型基础设施,包括支持开发的人工智能算法框架、 面向应用的人工智能算法平台和公共服务平台、用于算法模型训练的公共数据集等形态。
07区块链基础设施
区块链基础设施是区块链技术和理念工程实践的具体形态,包括支持开发的区块链开源底层技术平台、由公共链 网、跨链系统组成的网络服务设施、面向区域或行业应用的区块链公共服务平台等形态。
08量子计算云平台
量子计算云平台是一种在线提供量子计算资源和工具的云计算平台,用户能够便捷的利用量子计算进行计算任务。
09新型互联网交换中心
新型互联网交换中心是实现网络之间流量集中交换的国家级信息基础设施,是互联网网络架构的关键环节。
(部分内容来源网络,如有侵权请联系删除)