加入收藏 | 设为首页 |

数据垄断:怎么看 怎么办

隐私 时间:2019-08-12 浏览:
不知从什么时候开始,“数据垄断”成为了热门话题。在各种研讨会上,专家们开始大谈“数据垄断”;在各大报刊杂志上,也有显著的版面讨论“数据垄断”;而在微博

不知从什么时候开始,“数据垄断”成为了热门话题。在各种研讨会上,专家们开始大谈“数据垄断”;在各大报刊杂志上,也有显著的版面讨论“数据垄断”;而在微博和微信公众号上,更是不乏大V和意见领袖痛斥超级平台垄断数据,损害竞争和消费者利益。

那么,所谓的“数据垄断”究竟是什么?它会给竞争、给消费者、给整个社会带来怎样的影响?对于“数据垄断”问题,我们又应该采用怎样的态度来加以应对?要回答这些问题,我们恐怕还要从数据本身慢慢说起。

数据就是数据,不是现代的石油

在英文中,“数据”(data)一词最初源自于拉丁语单词“资料”(datum)。单从词源上,我们就很容易知道,它的本意是一种信息的载体,其作用是对信息进行存储和传播。如果根据这个定义,数据的历史几乎就是整个人类的历史——自从人们开始结绳记事,它就产生了,那一个个用绳子编成的结就是最早的数据。在计算机发明之后,“数据”一词的含义逐渐窄化,从原来的泛指慢慢变成了专指那些可供计算机存储和传播的信息。

无论是根据其本来含义,还是其现代含义,数据都不是最近才有的。但在很长时间内,人们一直没有对数据予以重视。数据在人们眼中的作用,不过是为了帮人们保存一段记忆,或者讲述一段故事,其价值更多是文化的,而不是经济的。

直到最近几年,一切才发生了变化。随着计算机技术的迅速发展和各种统计方法的涌现,人们渐渐掌握了通过挖掘数据来获取信息、指导实践的能力,原本被人忽视的数据从此摇身一变,成为了重要的生产要素。为了从数据中拷问出更多信息,数据的搜集和分析逐渐成为了单独的学问和生意。数据的规模(Volume)开始越来越庞大,数据的多样化(Variety)变得越来越高,数据的更新速度(Velocity)变得越来越快,而人们从数据中获得的价值(Val-ue)也变得越来越丰厚。在4个“V”的加持之下,就连数据本身也不再被简单称为数据。人们开始在它头上加上冠冕,尊称其为“大数据”(bigdata)。

由于在现代经济中,数据变得越来越重要,所以有一些人开始将其比喻为新时代的石油。应该说,作为一种突出数据重要性的比喻,它确实十分生动。不过,如果从性质上将数据简单类比为石油,那就大错特错了。事实上,作为一种新时代的重要生产要素,数据有很多属于自身的特点,而这些特点是和石油存在着显著不同的。

其一,从使用环节看,石油是一种竞争性的资源,而数据则是非竞争性的。竞争性是一个经济学的概念,若一种物品被一个人使用时,会妨碍或限制其他人使用,这种物品就被称为是竞争性的。很显然,根据这个定义,石油具有很强的竞争性——你多用一点,别人就只能少用一点。而数据则不同,一个人使用数据并不会妨碍其他人也对其进行使用。

其二,从生产环节看,石油具有很强的排他性,而数据的排他性则相对较少。什么叫排他性呢?就是一个人使用某物时,可以以较小成本排除其他人使用。我们知道,人们在采挖石油的时候通常会划分出一定的区域,在这个区域内,禁止其他人同时采挖。而数据的搜集则不同。在同一时间,不同的数据平台可能在对同一个人的相同信息进行搜集,彼此互不干扰,也不会相互排斥。

其三,从储量上看,石油的量是给定的,用一点就少一点。而数据则不同,人们使用数据,并不会使其减少。恰恰相反,通过对已有数据的开发和挖掘,还可以生产出新的数据。

其四,对于像石油这样的传统资源来说,重要的是数量,除了数量之外,并没有维度的概念。而对于数据来说,维度则具有至关重要的意义。如果一套数据只有一个维度,那么即使它的数量再大也没有意义。想象一下,即使你掌握了全中国所有人的体重数据,那又有多大用呢?但是如果你同时掌握了体重和消费开支这两个维度的数据,那就大不相同了。这时,你可以根据数据来推断不同的人愿意为减肥花费多少,并据此探索出相应的商业模式,从中发掘出经济价值。

其五,相比于石油等传统资源,数据具有更强的替代性。尽管从理论上讲,石油之类的传统资源也可以被替代,但其相对成本是很高的。例如要把一辆燃油动力的车改成燃气动力车,就需要花费很高的成本。而相比之下,数据之间的替代则比较容易。例如,我们想知道每个人住在哪儿,以便给他们定向投放广告。假如我们有相关的住址信息,那么很好,这个任务可以直接完成;但是如果没有地址信息,那也不要紧,因为我们完全可以通过其他数据,例如出行数据来予以推断,从而可以达到同样的目的。

综合以上几点,我们可以看到,尽管从商业价值来看,数据确实和工业时代的石油具有很强的类比性,但是在更多的性质上,它和石油等传统资源却存在着很多差别。数据并不是新时代的石油,数据就是数据。

数据可以被垄断吗

在花费了大量篇幅讨论数据作为一种新型资源的属性后,让我们言归正传,将话题回到数据垄断上来。这里需要指出的是,所谓“数据垄断”,并不是一个严谨的学术词汇,它主要流行于媒体报道和名人演讲。正因为如此,其实这个流行词汇并没有十分精确的定义。我翻阅了最近两年来关于“数据垄断”的很多文章,发现根据使用语境的不同,这个词其实有两个不同的含义。

第一个含义是对于数据的垄断,即指某些数据被某个企业独自占有了。这一点,主要是针对数据的生产和储存而言的。第二个含义则是,企业通过掌握的数据来获取,或者巩固自己的垄断地位。这一点,主要是针对数据的使用而言的。

先看第一种含义。在我个人看来,这个意义上的“数据垄断”其实是一个伪命题。为什么这么说呢?主要有两个理由:

第一,数据资源并不是恒定不变的,相反,它在不断地产生出来。由于这个特征,即使有企业真的独占了某一类数据资源,那也只能占有一时,不能占有一世。我们知道,在大数据时代,数据的价值是和其时效性密切挂钩的。因此,除非这个企业可以不断对新产生出来的数据加以垄断,否则其手中拥有的存量数据将很快失去其价值。

第二,正如我们前面强调的,数据搜集的排他性很弱,你可以搜集,但也不妨碍别人搜集。从这个角度看,某个企业也很难通过排除他人搜集来保证自己持久占有最新产生的数据。

当然,在一些特别的情况下,某些企业也可以通过技术手段来增强对数据搜集的排他性。例如,它们可以屏蔽掉第三方的爬虫软件,还可以用跟踪IP的手段来识别手动爬取数据的行为,但是这些都是需要投入不小的成本的。考虑到数据具有很强的替代性,一般的企业很少会有足够的激励去对其他数据搜集者严防死守,因为尽管这在理论上可行,但在经济上却未必划算。

数据可以帮助企业实现垄断吗

在“数据垄断”的两个含义中,真正值得引起人关注的是其第二个含义,即企业应用数据来获取、巩固垄断地位的行为。