睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

何为“数据垄断”:类型化与方法论

时间:2022-02-14来源:念念不忘浏览数:350

缘    起

随着数字经济的发展,大数据的价值越来越被各方所认可,与此同时,“数据垄断”也逐步成为了热门话题。但至今,“数据垄断”仍然是个模糊的概念,不同的人在讲“数据垄断”的时候,经常是基于不同的内涵和理解在讨论,以致于给人“数据垄断无处不在,却又不知具体在何处”的迷惑感。对“数据垄断”的不同内涵进行拆解,并就各个细分的内涵进行反垄断意义上的分析,是厘清迷惑、准确理解“数据垄断”相关问题的有效方式。

根据可查阅到的文献、网络文章、研讨会发言等对“数据垄断”的实质所指,本文总结以为,在反垄断意义上,可以将“数据垄断”的内涵区分为以下三类:

一是数据本身作为一种商品,企业在数据相关市场中具有垄断地位,即“数据被垄断”;

二是作为产品/服务的生产要素,数据成为企业的护城河,从而使得企业在该产品/服务的相关市场中实现垄断地位,即“数据使得企业取得垄断地位”;

三是已经在某产品/服务相关市场中具有垄断地位的企业,实施的垄断行为与数据相关,即“数据相关的行为构成垄断行为”。

先上结论

可以将数据相关的垄断困惑归纳为三类:

1)数据被垄断;

2)数据使得企业在其他产品/业务中取得垄断地位;

3)已经具有垄断地位的企业实施的某些与数据相关的行为构成垄断行为。

前两个困惑针对的其实是“垄断地位”,但反垄断的精髓是反对“垄断行为”,不反对“垄断地位”。本文分析结果显示,这两个论断也是难以成立的:数据有其特殊性,难以被垄断;数据也不足以成为企业的护城河,企业掌握大量数据是企业成功的“果”而不是“因”。

第三个质疑针对的是“垄断行为”。对于差别定价,虽然事实上可能会促进竞争,同时带来消费者福利的结构性改善,不应概括地被认定为垄断行为,但企业在拉新、促活等活动中应进行明示,保障消费者知情权。对于拒绝数据开放,在绝大多数时候难以被认定为垄断行为,但数据的双向开放、生态共赢是长期趋势,建议各方共同努力,通过技术手段搭建数据价值的互联互通网络,构建多元化、多层次的数据价值流通体系,充分释放数据要素价值。

数据可以被垄断吗?

根据《反垄断法》,认定经营者具有市场支配地位的因素包括市场份额、市场进入难易程度、经营者财力和技术条件、其他经营者对该经营者的依赖程度等。

分析认为,单个企业所掌握的数据份额不高,数据市场进入容易,收集数据对财力和技术条件要求不高,其他经营者的依赖程度较低,数据呈现“爆炸”式增长态势,这些都使得数据难以被垄断。

(一)从市场份额来看,数据分布分散,单个企业所掌握的数据的市场份额较低 

数据市场份额的准确计算可能是困难的,这不仅涉及到数据相关市场边界的准确界定,也涉及到数据市场份额的衡量指标。使用数据体量、数据质量、数据价值等计算的指标均可以在不同程度上衡量数据市场份额,但都不是完美的指标。不过,在绝大多数场景下,无论使用哪个指标,由于数据之间的可替代性,单个企业所掌握的数据的市场份额都是非常低的。以信贷场景为例,央行征信中心、百行征信、各大银行等信贷数据,政府部门收集的税务、社保、公积金数据,招行等银行的工资卡数据,支付宝和微信支付等支付数据,淘宝、京东、拼多多、苏宁、美团、携程等消费数据,腾讯等识别的朋友圈数据,领英、脉脉等职业数据,都是信贷风控的有效指标,从事信贷的机构,既可以使用央行征信中心的数据,也可以与支付宝、微信合作,还可以与京东、拼多多、脉脉等合作,也可以要求借款人提供收入流水单等信息,这些数据之间具有较强的竞争性和替代性。所以,在信贷场景中这些数据应当被划为同一个数据相关市场,在计算市场份额时,应把以上多类机构的数据加总作为分母。在正确界定相关市场后,无论使用何种衡量指标,单个主体的数据份额都不大可能超过50%,甚至很难高于10%。

(二)从市场进入来看,数据收集不具有排他性,市场进入较为容易 

与有形资产不同,数据的收集不是零和博弈。用户多归属性明显,相似的数据可同时被不同主体通过不同途径收集、拥有,不具有排他性。新入者只要找到合理的商业模式进入市场就可以获得相似的数据。例如,淘宝和天猫看似聚集了中国网络零售市场最大的消费者与商户数据,京东依然可以依靠差异化竞争获取大量用户及数据;在阿里系和京东已经掌握大量数据的情况下,拼多多依然可以快速崛起,与阿里和京东竞争并获取相同类型的数据。所以说,新进市场主体只要通过产品和服务创新吸引到客户,就可以收集到数据,并不受在位者的影响。数据来源除了自己业务沉淀之外,还可以通过数据经纪(数据交易市场)、上下游企业等渠道获得。今后,随着5G、物联网、工业互联网等技术的快速发展,数据收集途径越来越多,数据收集将更便利、更容易,数据壁垒更难形成。

(三)从财力和技术条件来看,收集数据的门槛较低,新进市场主体可能借助网络效应快速做大 

开发一个数据收集软件的成本并不高,网上售卖的爬虫软件价格在几百元到几万元之间。随着融资环境的优化和资本市场的发展,小企业获得财力支持的难度也在下降。财力和技术条件很难成为收集数据的拦路虎。尽管小公司或新进入者收集第一手数据的能力可能不如大型、成熟的企业,但这样的小公司数量众多,所掌握的数据量仍然十分庞大。新进入者还可以凭借创新吸引大量用户,而网络效应将进一步助力这些新进入者在未来更快地积累起更多的用户和数据。比如,抖音的运营主体北京微播视界科技有限公司的注册资本仅100万元,其凭借短视频创新,成立仅4年多,日活跃用户已经超过了6亿。

(四)从依赖程度来看,多样性是大数据发挥价值的重要基础,经营者对单一数据来源的依赖度低 

在大数据的5V特征中,多样性是一个不可或缺甚至最重要的特征。一个数据集的真实价值不单单依赖于提供这些数据的个体数量,还依赖于每个个体透露的信息数量。数据的多样性对信息量的正面影响可以直观地视为数据的范围经济效应。同样以信贷场景为例,经营主体会从多个渠道尽可能收集多维度的数据,工作单位、收入水平、家庭资产、信贷记录、消费习惯、履约习惯、朋友圈等维度的数据可能仅仅是其中一小部分,在数据来源方面不会依赖单一的经营者。很多时候,产品或服务的成功与否并不依赖于数据,这种情况下对其他经营主体对数据控制者的依赖程度就更弱了。

(五)分析数据市场支配地位时,还需引入动态、发展的视角,目前的“大”数据将在很短时间后变成“小”数据 

数据是可以不断生产出来的,而且正以“爆炸”式速度增长。目前的“大”数据将在很短时间后变成“小”数据。根据IDC和数据存储公司希捷2019年最新研究,中国2018年约产生7.6ZB数据,将在2025年增至48.6ZB,相当于2417万个中国国家图书馆的数字资源存储量,复合年均增长率达30.35%。另外,算法技术的发展,还可能使企业对数据量的依赖性迅速减弱。例如,Alpha Zero可以从空白状态学起,在无任何人类输入的条件下,能够迅速自学围棋,并以100:0的战绩击败“前辈”。Alpha Zero意味着不需要历史数据或只借助少量数据就可达到相关目的,数据量在将来或许不会成为一个问题。

数据可以使得企业取得垄断地位吗?

作为生产要素时,与资本、技术等其他生产要素一样,数据也会提高企业产品/服务的竞争力,却不足以成为企业的护城河,帮助企业在产品/服务的相关市场中取得垄断地位。

(一)从数据价值周期来看,数据价值随着时间推移快速衰减,数据价值难以持续发挥 

大数据5V特征中的“高速周转性(Velocity)”,也反映了数据收集和处理的实时性和即时性。也就是说,数据的有效价值,总是随着时间的推移而快速衰减。Statista网对谷歌广告数据研究显示,当今世上现有数据中90%创自于近2年,而那些仍未经加工的原始数据中70%过90天就将过时。数据信息贬值快的背后原因是外界世界变化快。现有数据只反映过去的状况,在瞬息万变的世界里规律性的东西或许已改变。历史数据或许在分析市场趋势方面有用,但是在指导即时决策方面的价值很有限。比如,过去的广告数据就无助于广告商在实时投标过程中决定展示哪个广告。同时,在像搜索引擎这样数据差异性大且更新率高的领域,历史数据的价值更低。据谷歌披露,其每天用户的搜索关键字和搜索结果排名记录中有15%是最新的,这意味着搜索算法不断需要新数据才能提供最相关的搜索结果排名。

(二)从数据规模报酬来看,数据呈现规模报酬递减的规律,因数据规模取得的竞争优势难以长期维持 

大规模的数据有助于更加准确地统计样本规律,减少统计推断的样本偏差,但偏差的减少幅度会随着数据规模的增加而不断减少。Lerner(2014)对在线搜索和在线广告市场的研究发现,用户数据用于改善搜索结果的质量提升的效果越来越差,用于提高广告投放到目标受众的精准度的效果也如此。鉴于规模报酬快速递减的特性,大规模企业可能在数据规模突破某个临界值后从额外新增数据中获得边际价值趋于零,而中小企业更可能从新增给定量的数据中获得严格正的边际价值,从而更有动力通过投资服务质量和研发环节,来吸引用户接入本平台。由于数据规模报酬递减规律的存在,新进入者要在数据要素层面富有竞争性,需要拥有的数据量将远远低于在位者通过多年积累的数据量。在2010年微软并购雅虎搜索业务案中,欧盟竞争委员会引用了微软提交的一份研究报告,该研究报告显示,对于绝大多数频繁使用的关键词,微软Bing搜索算法下的搜索结果与关键词间的相关度,与谷歌和雅虎搜索下的相关度的总体差距并不大,虽然前者与后两者在数据规模上有着巨大的差距。数据贬值很快且规模报酬也递减,仅凭借数据获得的竞争优势和市场支配地位会非常短暂,很不稳固,新进入者在数据收集和分析中不可能长期相对于在位者处于明显的竞争劣势。

(三)从竞争对手进入来看,由于数据的可获取性、可替代性、异质性,在位者对新进入者收集数据的影响较弱 

不同的企业可以通过不同途径收集、拥有相似或差异化的数据,在提供服务时可以基于与竞争对手相似的数据,也可以基于差异化的数据。也就是说,数据具有很强的可获取性和可替代性。数据的可获取性和可替代性也是欧盟竞争委员会和美国联邦贸易委员会在2007年前后无条件批准谷歌收购DoubleClick的重要理由。2012年的西班牙电信英国分公司/英国沃达丰/英国EE公司的合资案以及2014年的脸书并购WhatsApp案,也因类似逻辑而得到批准。相关实证研究也证明,数据存在着广泛的替代性。比如,Graef(2015)发现,搜索引擎借助搜索排序记录“交叉复现或验证”揭示出的对特定群体的音乐偏好结果,与社交网络对同一群体在社交平台共享记录揭示出的音乐偏好信息基本相同,Lerner(2014)证明,亚马逊收集到的购物记录数据,在提升广告精准化方面与谷歌拥有的数据一样高效。另外,企业的产品和服务往往是差异化的,新进入者一般都会专注于特定内容或细分领域,进行差异化竞争,这个时候,即便提供的服务类型相同,最适合其发展所需要的数据也不尽相同。比如,在由脸书主导的全球社交网络领域,照片墙(Instagram)、推特(Twitter)和拼趣(Pinterest)等跟随者就专注于图片分享和微博客等特定内容交互,红迪网(Reddit)专注于新闻交互,领英(LinkedIn)、玻璃门(Glassdoor)和千真万确(Indeed)专注于职场交互等子领域。在中文社交网络领域,QQ和微信是绝对主导者,但新浪微博、易信、今日头条、快手等跟随者,专注于特定细分市场,并取得了良好发展。

(四)从企业成功要素来看,数据不是产品/服务竞争力的决定性因素,绝大多数时候是企业成功的“果”而不是“因” 

从数据海洋中提炼出有用信息的能力,并不单单取决于可获取的数据量,更取决于数据分析要用到的算法和能力,数据不是产品/服务竞争力的决定性因素。正如Varian(2009)所言,相对于大数据的收集和获取,解读海量数据和从中提取价值的能力才是更为重要的一环。Lambrecht和Tucker(2015)指出,“几乎没有任何证据可以证明在不断变化的数字经济中,仅仅依靠数据就能充分排斥更优的产品或服务的供给。要想建立可持续的竞争优势,数字战略的重点应当放在如何使用数字技术,给用户带来价值上面。”数据更多时候是企业成功的“果”,而不是“因”。例如,谷歌在初创时期,它拥有的数据量远比不上微软和雅虎,但它拥有先进的算法,其搜索服务做得更好,以至于连微软、雅虎都把搜索外包给它,谷歌目前所拥有的大数据是其成功的副产品。再如,在通讯应用领域,后起之秀WhatsApp成功地抵挡住了手握海量用户数据的长期在位者AOL的激烈竞争,凭借低成本又易使用的用户接口和对用户诉求的关注得以发展壮大。国内的典型平台软件微信/淘宝等的成长秘籍,都不是大数据,而是对用户诉求的关注和对痛点的克服。经济学家杰弗里·曼恩曾对不少互联网企业的崛起进行过分析,结果发现成功的互联网公司开始时都几乎没有数据,更不是什么数据驱动型的企业。他由此得出一个重要结论:数据更多的是互联网平台持续运行时的副产品,而不是创建互联网平台时的关键。

差别定价、拒绝数据开放、降低隐私保护水平应该被认定为垄断行为吗?

前述“数据被垄断”和“数据使得企业取得垄断地位”这两个问题讨论的实质上是垄断地位,而不是垄断行为,需要强调的是,反垄断的精髓是反对垄断行为,而不反对企业通过有序竞争实现市场领先地位。那么,当一个企业已经在某产品/服务的相关市场中取得垄断地位后,如果发生实施差别定价、拒绝数据开放、降低隐私保护水平这类与数据相关的行为,这些行为应该被判定为垄断行为吗?这需要对该行为的排除、限制竞争的效果进行分析,并结合是否有正当理由来判定。分析认为,基于数据实施差别定价和拒绝数据开放在很多时候不应该被认定为垄断行为,而对于隐私保护问题,利用反垄断法保护隐私在理论和实践上都存在着很难克服的障碍,消费者权益保护法、个人信息保护法等才是解决隐私保护问题的有效法律。

(一)差别定价在日常生活中普遍存在,可能会促进竞争,同时带来消费者福利的结构性改善,不应概括地被认定为垄断行为,但在现行法律环境下公司还是应审慎为之 

差别定价,在经济学上也叫“价格歧视”,其实是一个中性的词,在日常生活中也是普遍存在的。价格歧视可以分为三类,分别是一级价格歧视、二级价格歧视和三级价格歧视。其中,二级和三级价格歧视比较常见,比如,电信运营商不同的流量包单价不同就属于二级价格歧视,学生优惠价就属于三级价格歧视。标准的一级价格歧视较难发生,国债发行中的“美国式招标”(又称“多种价格招标”)规则,在形式上比较接近一级价格歧视。在大数据时代,包括一级价格歧视在内的差别定价变得更为容易,一级价格歧视使得同一产品呈现出千人千面的价格,消费者心理上觉得不公平,难以接受,网络上使用一个明显具有负面色彩的词“大数据杀熟”来形容这种现象。消费者的不公心理,是完全可以理解的,不过,在反垄断意义上,基于大数据分析的差别定价是否应该被认定为垄断行为,应综合考量该行为对竞争和社会福利的影响。

从对竞争的影响来看,差别定价可能会促进竞争。在统一定价时,每个企业只能服务一部分用户,价格接受程度低于统一价格的,就被排除在该企业的服务之外;在差别定价时,企业服务对象的范围将得到扩展,这使得同一批用户被更多的企业所覆盖,从而强化企业之间的竞争。OECD的研究报告认为,与传统的价格歧视相比,个性化定价对于竞争具有更加明显的促进作用,其可以优化静态效率和激励创新。从对社会福利的影响来看,差别定价不影响社会总福利,同时有可能带来消费者福利的结构性改善,“二级价格歧视”更多往“一级价格歧视”转变,还会增强公平性。

从静态来看,差别定价是将部分消费者剩余转移为生产者剩余,不会对社会总福利产生不利影响。而且,很多时候,差别定价并没有改变价格接受程度高消费者的价格,并没有损害其利益,而仅扩展到了原本没被服务到的消费者,使其享受到了低价的服务,这部分消费者的福利得到了改善。“大数据杀熟”主要是“一级价格歧视”的运用,如果把“一级价格歧视”与以往更为常见的“二级价格歧视”相比较,我们会发现,前者的公平性反而更好,更有利于提高低收入者的福利:在“二级价格歧视”下,由于信息不对称的存在,商家会给予购买量大的消费者更低的价格,而低收入者因为购买量小反而被收取相对更高的价格;但在“一级价格歧视”下,商家向高收入者收取高价、向低收入者收取低价,这应该更符合我们对于公平的感知。

所以,大多数时候,差别定价会改善消费者福利结构,“二级价格歧视”更多往“一级价格歧视”转变,会增强公平性。应当引起注意的是,虽然从竞争和社会福利的影响分析来看,差别定价绝大多数时候不应该被认定为垄断行为,但根据现行的法律和目前《关于平台经济领域的反垄断指南》的条款,企业在差别定价方面还是应当审慎。如果没有正当理由和合理的提醒,进行差别定价非常有可能被认定为垄断行为。比如,“杀熟”的主要目的是拉新,但如果没有合理的提醒,比如说“首单减免XX元”、“新用户减免XX元”,侵害消费者知情权,被认定为垄断行为的法律风险还是很高。

(二)拒绝数据开放构成垄断行为的前提应该是该数据构成“必需设施”,但由于数据的可获取性、可替代性、异质性,特定数据很难成为“必需设施” 

数据相关的拒绝开放主要表现为禁止其他经营者收集其网站数据或者拒绝数据交易。拒绝开放在大概率上会对其他经营者的生产经营和竞争力产生影响,不过影响程度需要依据个案进行分析。然而,原则上,企业并无义务促进竞争对手业务的发展。在一般情况下,将强制开放义务附加在企业之上,与市场竞争的自由契约精神相悖。

另外,数据并不是天然存在的,而是生产出来的,数据的生产需要投入大量的人力、物力、财力,企业对其生产出来的数据应该具有相应的财产性权益和竞争性权益。如果企业对数据的财产权利得不到应有的保护,数据生产所带来的收益就具有不确定性,企业对于数据生产的积极性就会受到打击,这会威胁到数据的生产投资和积累,对数字经济发展产生负面影响。拒绝数据开放构成垄断行为的一个可能分析方法是基于“必需设施理论”(essential facility doctrine)。目前,必需设施理论在我国也有讨论,原国家工商总局于2010年公布《工商行政管理机关禁止滥用市场支配地位行为的规定》第4条第5款引入了必需设施理论,国务院反垄断委员会2017年向社会公开征求意见的《关于滥用知识产权的反垄断指南(征求意见稿)》第15条也规定了“必需设施”原则。

在判断具有市场支配地位的企业所拒绝交易的数据是否构成“必需设施”时,关键在于判定下游企业是否能“绕开”特定数据同样开展商业经营活动。相比于港口、码头、铁路等基础设施或其他知识产权而言,数据具有明显的可获取性、可替代性、异质性等特征,拒绝数据开放对竞争程度的负面影响可能较小,特定数据很难成为“必需设施”。因此,拒绝数据开放在绝大多数时候难以被认定为垄断行为。

(三)消费者权益保护法、个人信息保护法等才是解决隐私保护问题的有效法律,利用反垄断法保护隐私在理论和实践上都存在着很难克服的障碍 

隐私保护水平已经成为衡量现代网络产品或服务质量的一个重要指标。有观点认为,由于外部竞争约束的降低,具有垄断地位的企业会降低隐私保护水平,该行为属于垄断行为,特别是在服务免费的情况下,竞争评估中应将对隐私保护这一重要非价格因素的影响考虑在内。

隐私保护问题,即使与垄断竞争问题相关,这种关系应该也是非常微弱的,而且利用反垄断法保护隐私在理论和实践上都存在着很难克服的障碍。首先,竞争程度与隐私保护水平并不一定呈现线性关系,可能呈现倒U型关系,即垄断者可能缺乏动力提供较高的隐私保护水平,而竞争激烈的市场格局也倾向于降低隐私保护程度,通过反垄断增强竞争程度,不必然带来隐私保护水平的提高。其次,反垄断执法机构没有良好的工具来具体测量隐私保护水平的降低幅度,也无法判断隐私保护的最优水平。

此外,隐私保护与反垄断法的救济是相冲突的,反垄断法的救济措施可能包括禁止收集数据、强制开放数据等。在数据收集领域,如果禁止企业收集用户信息,反而可能带来价格上涨、降低用户体验等问题;在数据提供领域,若强制企业共享数据,又可能与隐私保护这一目标相悖。所以,消费者权益保护法、个人信息保护法等才是解决隐私保护问题的有效法律,反垄断法并不适宜实现此目标,在反垄断意义上讨论隐私保护问题,实际意义不大。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询