摘 要:人类已进入大数据时代,大数据的广博性、关联性和战略性引发世人关注。与此同时,国家独享“绝对主权”时代终结,传统理念无法适应国家管控海量数据传送和集聚的现象,数据主权随之应运而生。文中通过对已有数据主权概念进行辨别分析,厘清数据权、个人数据权利、信息主权、网络主权与国家数据主权的关系,从国家视角进一步界定数据主权概念。基于国家间数据主权博弈、数据跨境流动、大国数据霸权和数据处理的自身特征等因素,各国有效行使数据主权能力十分有限,国家数据主权面临威胁和挑战。最后提出我国应对挑战、捍卫数据主权的几点举措:构建中国国家数据战略、提高核心数据控制能力、实现数据自由流通与数据跨境管控之间的合理平衡。
关键词:大数据的特性 国家数据主权 概念辨析 威胁和挑战 应对举措
随着移动互联网、云计算、物联网等新科技的飞速发展,遍布全球的传感器成为数据来源和数据载体,以及承载数据信息的智能手机、平板电脑和PC的使用普及率不断攀升,大量数据飞速生成和聚集,催生了数据规模的爆炸式增长,标志着人类已进入大数据时代。大数据发展超越了原先以国土疆界为划分的安全概念,数据主权逐步引起各国重视。与此同时,一国不能有效管控其主权范围内的数据及本国居民跨境流动的相关数据,数据主权面临巨大挑战。本文以理解大数据的三个维度为切入点,通过厘清数据权和数据主权等几对关系,挖掘数据主权的内涵,进而分析国家数据主权面临的挑战并提出我国捍卫数据主权的应对之策。
一、理解大数据的三个维度
大数据是指PB级以上的数据集合,由于信息量过大,传统的存储设备无法进行搜集、存储和处理,人类开始利用新的技术对数据进行管理。随着大数据的关注度日益升高,其4“V”特点逐步被人们所认可:以TB级跃升至PS级的庞大数据规模量(volume)、结构化数据与非结构化数据并存的多样数据类型(variety)、实时在线处理的及时高速性(velocity)和价值密度低且数据价值巨大(value)。理解大数据不能局限于4“V”特征,我们还应从它的广博性、关联性和战略性进行分析。
(一)大数据的广博性
首先,大数据的体量庞大,而且规模呈现不断扩大趋势。当前海量数据规模已超出传统计算机处理数据量的级别。数据体量已从GB(1GB=1024MB)升级到TB(1TB=1024GB)、PB(1PB=1024TB),甚至EB(1EB=1024PB)和ZB(1ZB=1024EB)。2011年国际数据公司(IDC)的研究报告中提出,今后十年大数据将递增50倍,截止2020年世界数据量高达35.2ZB。当前,一些大企业的数据量甚至达到PB量级,截止2014年3月阿里巴巴数据量已超过100PB。
其次,大数据种类繁多,来源广泛。从大数据类型上看,包括结构化数据、半结构化数据和非结构化数据。结构化数据是指传统数据库收集的数据,能够用数据或统一的结构加以表示,包括互联网世界中人与人的交互信息、物联网世界中的商品和物流信息以及企业内部的经营交易信息等。非结构化数据来自社交网络和物理传感器,包括话语、图片、影像以及电子探头数据等。近些年来,随着智能设备和视频器材的普及,大数据的来源越来越广泛,非结构化数据不断涌现,每年以60%的速度持续增长。到2012年底,非结构化数据已占整个数据量的75%以上。从大数据来源上看,可以分为三类:一是由用户自主输入和提交的数据;二是由采集器-终端采集的数据;三是卫星收集的全球数据;四是在使用过程中形成的“元”数据。这些数据已经超过了ZB,也就是万亿GB的水平,任何具备有效使用这些数据的行为体,将获得巨大的经济收益、政治影响力和安全能力。
再次,大数据使用程度多样化,使用状态多元化。美国信息存储资讯科技公司(EMC)按照使用程度和使用状态将大数据划分为三种:活跃数据,被有效标识并已经使用的数据;唤醒数据,已被标识但并未有效使用的数据;沉睡数据,既没有被标识也没有得到有效使用的数据。EMC公司在《数字宇宙》报告中指出,沉睡数据高达80%。由此可以看出,人类对数据的使用仍然处于非常初级的阶段,庞大的沉睡数据有待于人类开采使用。
(二)大数据的关联性
大数据的“大”不仅仅指“量”的庞大,还深层次的揭示了数据生态系统相互关联的特性。由于数据显性化和网络隐形化的结合,数据之间的复杂关联无所不在。“关联性”是指两个或两个以上变量的取值之间存在某种规律性。大数据的价值来源于数据之间的相互关联,例如个体不同信息之间的关联、不同个体相互之间的关联、不同群组之间的关联、甚至是信息本身的结构关联等。大数据的关联分析沿革了统计学的特点,并不是建立在因果关系上的逻辑推理研究,而是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳,目的是找出数据集里隐藏的相互关系网(关联网),一般用支持度、可信度、兴趣度等参数反映相关性。例如,两个数据A和B有关联性,可以看出A和B在取值时相互有影响,并不代表有A就一定有B,或者有B就一定有A。因此,大数据处理是一种能力,即用关联方法从看似没有价值的数据中挖掘出有用信息的能力。
运用大数据的关联性揭示事务的规律性十分重要。对于简单封闭的系统,小数据的因果分析简单易行,这是一种基于有限数据样本而不得不对客观世界进行简化的结果。但对于开放复杂的巨系统,传统的因果分析难以奏效,因为大数据处理的是流式数据,价值密度低,数据规模不断变化,变量间的因果关系具有时效性,往往存在此一时、彼一时的情况。系统中各个组成部分之间随着时间关系相互影响,可能互为因果,因果关系隐藏在整个系统之中。现在的“因”可能是过去的“果”,此处的“果”也可能是别处的“因”,因果关系本质上是一种相互纠缠的相关性分析,相关关系是为了间接地认识因果关系。这就需要我们运用相关性来揭示大数据背后的规律性。日常生活中,个人、群体和国家都会在不经意中留下各种各样的“数据脚印”。例如,阿里巴巴公司根据客户的购买行为、手机全球定位卫星数据以及可穿戴设备上产生的数据,挖掘出客户的相关“推测数据”(inferred data)。这些数据若是经过系统联系、处理和归纳总结,就会揭示个体和群体有价值的规律性,影响个人、群体乃至国家的生存和安全。上文提出,近10年来增长最快的数据是网络上传播的各种非结构化或半结构化的数据。网络数据的背后是相互联系的各种人群,根据相关数据可以洞察到近期国家信息空间是否安全和社会是否稳定。因此,大数据的关联性分析,是揭示事务本质、搜取信息规律性的关键所在。
(三)大数据的战略性
大数据是社会高度信息化的必然产物,事关国民经济运行安全和社会稳定。“大数据堪称智能交通、智能电网、智慧城市等国民经济运行和社会发展高度依赖的信息基础设施‘血液’,这些重要的信息系统、基础设施网络化智能化程度越高,安全也就越脆弱;速度越快,风险也就越大。”人类越来越倚重以大数据为支撑的基础设施,大数据的安全与否已关乎社会稳定和国家安全,若社会的“血液”发生问题,则造成肌体的影响和损失是难以预计和估量的。2011年,索尼发生重大数据泄密事件,用户的姓名、电子邮箱地址、密码、信用卡号等均被曝光,牵连7700万用户,损失成本高达1.71亿美元,PSN服务关闭23天。
大数据是与自然资源、人力资源同样重要的战略资源,是一个国家数据主权的体现。大数据将成为国家主权实施的权力基础,数据成为社会权力的重要来源。大数据蕴藏着最新科技、社会动态、市场变化、国家安全威胁征兆、战场态势和军事行动等各种政治、经济、文化、安全等信息。信息权力不仅是主权国家控制国内社会的基础,信息权力还是外交力量的倍增器。因此,数据为王的大数据时代的到来,谁能够占有大数据,谁就能占据庞大的数据“宝藏”;谁能最大限度地挖掘大数据中的价值,谁就能拥有“未来新石油”的控制权。这已经成为国家的核心竞争力。
二、国家数据主权的概念辨析
随着科学技术的发展,国家传统主权范围逐步扩大,主权概念也随之扩充其内涵与外延。随着“大数据时代”的到来,国家独享“绝对主权”时代终结,已有的信息主权无法适应国家管控海量数据传送和集聚的现象和行为,数据主权便应运而生。目前,国内外学术界对数据主权概念界定各有侧重,并未形成统一认识。通过厘清各种关系,正确辨析国家数据主权的概念,是研究数据主权的逻辑起点。
(一)从传统主权概念的沿袭进行界定
传统主权将国家主权概括为对内最高统治权和对外独立权。博丹在其《主权论》中明确指出:国家主权是一个国家的固有属性,是一种以国家为范围的对内最高统治权和对外独立权。国家主权以国家地理疆界为界限,不可转让、不可分割、不受限制。可以看出,博丹认为,不论是对内最高权还是对外独立权,都具有最高的权威性和排他性,不受任何外部实体的制约和影响,是国家利益的核心问题之一。
目前,一些学者沿袭了传统主权的概念,将数据主权的界定回归到传统主权的含义中。有学者从对内最高统治权进行界定,认为数据主权的主体是国家,是一国独立自主对本国数据进行管理和利用的权利。还有观点认为,数据主权除包含对内控制权外,还应涵盖对外独立性两个层次。他们将数据主权定义为:国家对数据和与数据相关的技术、设备、服务商等的管辖权及控制权,体现域内的最高管辖权和对外的独立自主权、参与国际事务的合作权。齐爱民将捍卫数据主权上升为一种原则,即数据主权原则——对内体现为一国对其政权管辖地域内任何数据的生成、传播、处理、分析、利用和交易等拥有最高权力;对外表现为一国有权决定以何种程序、何种方式参加到国际数据活动中,并有权采取必要措施保护数据权益免受其他国家侵害。 可以看出,数据主权是国家主权内涵的延展和扩充,数据主权的概念本应回归传统主权的应有之义,但以上界定并未凸显数据主权的特殊性。
(二)从数据主权实施的内容上进行界定
当前,与数据主权相关的概念种类繁多,例如广义数据权、狭义数据权、数据权利、数据权,以及数据所有权和使用权等等,这些概念相互交织、错综复杂,只有厘清彼此间关系,才能准确辨析数据主权的概念。
从主权实施的范围看,有学者将数据主权分为狭义数据主权和广义数据主权。狭义数据主权单指国家数据主权,广义数据主权包含了国家数据主权和个人数据主权。顾名思义,国家数据主权的主体是国家,个人数据主权的主体是公民。多数西方学者提到的数据主权多指个人数据主权,而中国学者主要强调国家数据主权。个人数据主权与国家数据主权之间的关系可以表述为:个人数据主权只能置于国家数据主权的框架下、在国家数据主权的范围内运作,只有这样个人数据主权才能得到有效的保障。美国学者乔尔?荃齐曼(Joel Trachtman)曾指出,个人数据主权的实现需要以国家数据主权作为基础和前提,而国家数据主权的维护又基于个人数据主权的支撑和表达。
从主权实施的主体看,数据权包括数据权利和数据主权两方面。2009年以来,美、英、澳等国纷纷开展“数据民主”运动,把政府之前专项的公共数据放在了政府数据门户网站上,英国首相卡梅伦正式提出“数据权利”(Right to Data)的概念,他认为这是信息社会一项基本的公民权利,承诺要继续在全社会推向深入。由此可以看出,数据权利等同于个人数据主权,是相对应公民数据采集义务而形成的对数据利用的权力,即用户对其数据的自决权和自我控制权。具体包括对个人隐私权、生命财产的数据保护、对企业资产的数据保护和本国公民和其他境内行为体在国际社会的数据保护等。而数据主权是指大数据时代的国家主权,很多欧美国家更多强调是网络空间中的国家主权。数据主权和数据权利共同构成了数据权,因此,数据权相当于广义数据主权的内容。
从主权实施的方式看,有学者认为数据主权是数据所有者占有、使用和处分其数据的能力。也有学者提出这种界定没有体现主权国家的治权,即对本国领域内的数据进行管辖的权力。本文认为,一国公民在境外形成的数据也属于该国管辖范围。曹磊将数据主权概括为数据所有权和数据管辖权两方面。数据所有权指主权国家对于本国数据排他性占有的权利。数据管辖权是主权国家对其本国数据享有的管理和利用的权利。蔡翠红认为,数据主权意味着数据即使被传输到云端或远距离服务器上,仍然应受其主体控制,而不会被第三方所操纵。综合以上观点,本文认为数据主权应包括数据所有权、控制权、管辖权和使用权。
(三)与信息主权、网络主权相比较进行界定
随着互联网的兴起和发展,主权概念从实体空间蔓延到虚拟空间,人们开始热议信息主权和网络主权。而随着大数据时代到来,数据主权延展了国家主权的内涵。基于信息主权、网络主权和数据主权三者之间的关联性,可借鉴信息主权、网络主权等概念,通过对比分析,得出数据主权的独特性质。
数据主权与信息主权一脉相承,均演化自国家主权的概念,是国家主权的重要组成部分,是一个国家对本国网络、数据中心、信息系统中数据进行自主管理的权力。但从本质上看,数据主权和信息主权区别很大。首先,两者产生的背景不同,“大数据时代”已代替了信息时代这一称谓。在当前世界数字化、信息化、网络化、全媒体化的背景下,作为信息技术发展产物的数据资源呈爆发式、快速且多样化的增长,其影响已经超过了信息技术本身。其次,数据主权体现更多的技术性,其在移动终端的普及、廉价存储设备、高速宽带、云计算和物联网等技术对传统信息通讯工具的变革中应运而生,涉及数据的生成、收集、存储、分析、应用等各环节。再次,数据和信息的界定有质的差别。数据和信息的区别在于数据是按一定规则排列组合的物理符号,表现形式为数字、文字、图像和计算机代码,而数据经过一定的工具加工整理成为信息( information) 。人们在生活中及互联网虚拟空间里留下了大量的数据,这是一种无意识的数据行为,而数据要经过加工和解读才成为被人们能使用的信息,这是一种有意识的信息行为。学者汪晓风认为:“如果把数据理解为矿产资源,信息就是采掘出来的原材料,进一步加工就成了产品,即知识。那么数据主权相当于国家对自然资源和领土的所有权。从这个意义上而言,数据主权比信息主权更有价值,因为国家可以对矿产资源拥有主权,但在市场体系中国家对于生产资料和产品只有分配权和收益权。可以看出,大数据时代的数据概念已不同于信息时代的信息,数据是信息的原生态,数据主权中数据所涵盖的范围要远远超出信息的范畴。
网络技术的发展为国家主权赋予了新的内涵,由此诞生的网络主权就是一国国家主权在网络空间中的自然延伸和表现。对内,网络主权指的是国家独立自主地发展、监督、管理本国互联网事务;对外,网络主权指的是防止本国互联网受到外部入侵和攻击。数据主权与网络主权交叉融合比较多,一些欧美国家认为,数据主权是指网络空间中的国家主权。但数据主权不能简单的等同于网络主权,网络不能涵盖数据主权的行使区域。在大数据时代,网络空间无疑是当今数据主权行使的最重要场域,但信息的发送和接收不仅限于互联网,还可通过电报“遥感技术”卫星传播等路径实现。因此,单纯以网络空间界定数据主权的管辖范围显得过窄。另外,网络主权主要体现在国家对网络信息技术的监管上,包括网络物理设施运行安全的保障,以及采用技术手段对网络信息安全进行维护。这为数据主权的界定提供借鉴,无论是网络主权还是数据主权都体现出国家对信息及相关技术、设备等的管理权及控制权。换言之,在大数据时代,一国对数据的管辖范围不限于数据本身,还包括与数据相关的技术、设备,乃至提供技术服务的主体等。当前,网络主权意识逐步提升,在我国已提升到战略高度。与此同时,数据主权意识也应提高到与网络主权意识同等的高度。
根据以上概念的对比分析,数据主权可以概括为,在大数据、云计算背景下,一国对本国的数据及本国国民跨境数据拥有所有权、控制权、管辖权和使用权,是国家数据主权和个人数据权利的总和,体现为对内的最高数据管控权和对外的数据处理权。
三、国家数据主权面临的威胁和挑战
数据主权的提出是主权国家维护其权威和合法性的必然要求。但基于国家间数据主权博弈、数据跨境流动、大国数据霸权和数据处理的自身特征等因素使各国有效行使数据主权能力十分有限,其存储、管控数据能力有所弱化,主要体现为:
(一)国家间数据主权的博弈争夺日益激烈
为了争夺数据信息网络的主导权,各国之间的数据主权博弈日益加剧,世界各发达国家相继推出“数据治国”战略并制定相关发展战略,争取赢得先机。美国最早将大数据提升到国家战略层面,将大数据纳入重要的战略资产。2012年3月奥巴马政府公布了“大数据研究和发展倡议”。美国还确立了基于大数据的信息网络安全战略,其国家创新战略、国家安全战略、国家产业发展战略以及国家信息网络安全战略都以大数据为重要依托。可以看出,美国已将大数据研究上升到国家层面,成为国家意志,这是全世界首次将大数据写进国家政策。与此同时,欧洲国家也从战略层面重视大数据,并已积极进行战略布局。欧盟及其成员国已经制定大数据发展战略。欧盟的科学数据基础设施投资已超过1亿欧元,并将数据信息化基础设施作为Horizon2020计划的优先领域之一。
随着大数据重要性日益凸显,各国的数据资源竞争愈发激烈,数据主权成为各方争夺的焦点。2000年12月美国商业部跟欧洲联盟签署了《安全港协议》(Safe Harbor),该协议规定美国公司从其欧盟附属公司传输数据时受到特定限制。安全港协议要求:收集个人数据的企业必须通知个人其数据被收集,并告知他们将对数据所进行的处理,企业必须得到允许才能把信息传递给第三方,必须允许个人访问被收集的数据,并保证数据的真实性和安全性以及采取措施保证这些条款得到遵从。“9•11”事件之后,为了防止恐怖主义,美国总统乔治•沃克•布什(George W. Bush)签署了《爱国者法案》(USA PATRIOT Act)。该法案增强美国联邦政府搜集和分析全球民众私人数据信息的权力,间接扩张了美国警察机关的权限,警察机关可以搜索电话、电子邮件通讯、医疗、财务和其他种类的记录等。美国情报机构还可以直接进入微软、雅虎、谷歌等互联网公司的服务器和数据库获取欧洲数据中心的数据。虽然《爱国者法案》和之前签署的《安全港协议》有较大的分歧和矛盾,但美国认为《安全港协议》不及《爱国者法案》的法律效力,因此美国并未受《安全港协议》束缚,仍然随意地调取9家互联网公司的数据信息。针对美国的行径,2012年欧盟委员会提出改革数据保护法规,试图对所有在欧盟境内的云服务提供者和社交网络产生直接影响。
随着“棱镜门事件”的持续发酵,欧盟、俄罗斯等国不断强化数据法规政策的建设。德国总理默克尔表示,欧洲互联网公司应当将相关数据的流动情况告知欧洲,如果与美国情报部门分享数据,首先必须经过欧洲人的同意认可;德国本国公民数据的行为必须遵守德国的法律。 2014年3月欧盟议会高票通过《欧盟个人数据保护条例》(草案),促进形成欧盟数字统一市场。俄罗斯也通过立法限制数据流动范围来提升数据控制力,2014年7月俄罗斯议会通过了《个人数据法》,规定俄罗斯公民个人数据必须保存在俄罗斯境内服务器上。
可以看出,欧洲国家处于数据控制弱势地位,其对数据的主权争夺的意愿更加强烈,而美国在网络空间和数据控制上占有总体优势,其控制数据的欲望不会减少,今后对数据的占有和利用成为大国间竞争和博弈的关键力量。
(二)数据跨境流动对国家数据主权形成冲击
数据主权提出的前提是数据的跨境流通。联合国跨国公司中心对跨境数据流动的界定是:跨越国界对存储在计算机中的机器可读的数据进行处理、存储和检索。一般来说,跨境数据流动可以分为两类:一种是数据跨越国界传输和处理;另一种是数据即使没有跨越国界,但被第三国的主体访问。基于数据跨境流动,数据主权的维护面临更多难题:
第一,数据跨境流动形成不同的主体,各主体管辖权交叉重叠。在大数据时代,数据流动至少涉及信息创造者、接收者和使用者,信息的发送地、运送地及目的地,信息基础设施的所在地,信息服务提供商的国籍及经营所在地等。信息创造者、接收者和使用者在行使跨境数据行为时,均对自己有利的数据信息主张主权,这势必形成主权的交互重叠、甚至冲突。
第二,云计算、云存储中的数据主权归属问题争议很大。当前数据处理和存储设备由固定的硬件系统转变为“云”,即由网络来为数据的计算和存储提供资源和服务。像跨国公司谷歌、亚马逊、苹果公司、IBM、英特尔公司,国内公司如阿里巴巴和百度都提供了云服务的产品。而在这些云计算、云存储之中的数据属于哪个公司,或是属于哪个国家,在国际上争议很大。同时,为满足客户需要和降低成本考虑,网络商经常将其提供的服务部分外包,因此,经常会出现这样的结果:不同的国家同时管控同一条数据。例如,A国采集的数据存储在B国C公司的数据中心,B国C公司又将数据服务外包给D国,该数据最终被E国的用户使用。那么,各国数据主权该如何主张?如果出现了纠纷,各国数据主权又该如何维护?依据哪个国家的法律进行维权呢?
第三,在国际上并未制定相关的跨国数据流动规则,而根据储存者、占有者或传输者的不同,数据信息将受多个不同国家法律所管辖,各国的数据权保护法律又不尽相同,这就导致数据主权纠纷频发。当下,国际社会并未对各国的数据主权管控范围进行划定,数据主权在国际法的制定方面尚处空白。数据在无政府状态下运行,各国基于理性自保的需求,积极加强本国数据的管控和本国国民在他国数据的主权主张,这必然导致主权交叉重复的管辖状况。同时,在多重管辖权的情形下,将会出现服务提供商挑选法律的现象,会导致网络服务商通过信息转移逃避对数据保护的国内规制,从而加剧数据管控的复杂性。
(三)数据霸权加剧大国对他国数据主权的侵犯
在信息化、数字化和全球化发展的大背景下,数据强国对其他国家形成权力不平等,并积极推行数据垄断和数据霸权。“数据主权”的提出是各国对大国滥用权力的有效限制及维护自身国家主权的现实要求。
借助于国际互联网、大众传媒等信息生产、流动平台的辐射,美国霸权在世界范围实现了迅速的扩展。这种不对称的信息流动和数据流动所产生的吸引力和影响力,增强了美国的力量和影响,在美国全球战略中发挥了其硬实力不可替代的作用。如今,美国借助其各大网络数据公司的力量,再次站到了大数据创新的潮头浪尖。2012年12月国际数据公司对“数字地球分布”进行了统计,各国在数字地球中的占比分别是:美国32%,西欧总和32%,中国13%,印度4%,其他国家19%。可以看出,美国占有全球数据的1/3,具有绝对优势。
美国不仅占据数据强国地位,而且利用自身优势力推数据霸权政策。早在布什政府时期美国就通过监听电话获得个人数据,奥巴马政府通过网络和卫星等技术优势攫取境内外数据,严重侵犯他国数据主权和安全。美国在“9•11”事件之后出台了《爱国者法案》,美国不仅通过国内立法实现其对域外数据的控制权,还借助国家安全部门收集并分析他国所管辖的数据。“棱镜门”事件是美国安全部门窃取他国数据信息的强有力证据。斯诺登曾向媒体爆料,美国政府通过棱镜项目直接从微软、谷歌、雅虎等9家公司服务器收集信息,窃取了对包括苹果手机在内的所有主流智能手机的用户数据,包括电子邮件、通讯信息、网络搜索等。同时,美国利用间谍软件和加密技术进行监控也屡见不鲜。《纽约时报》在2014年曾披露,全球10万台计算机都在美国监控范围内,美国国家安全局(NSA)是通过间谍软件“量子”进行监控实施。美国还牢牢掌控着“云”端的数据信息。当前,全球实力最强的云处理服务都是由美国互联网公司,例如谷歌、微软、亚马逊和脸谱等提供的。按照《爱国者法案》的规定,不管是不是美国公民,只要在美国互联网公司提供的“云”中存储数据,那么美国政府就有权对该数据进行搜集和处理。美国网络霸权地位为其数据强权的扩张提供了平台,数据霸权是美国网络霸权的深化与延展。
(四)数据处理的特征弱化数据主权的维护
大数据和云时代的数据处理与传统方式相比,具有新的特点,由此弱化了国家对数据主权的维护。
第一,数据量大造成国家对数据管控十分困难。云时代数据量庞杂,跨境传输时数据被泄露被窃取时有发生;另外,一国对本国数据不可能完全掌控,如果一国承认本国掌控能力有限,就等于对不完全主权的承认。
第二,大数据以复杂关联的数据网络形式存在,使国家难以控制数据。数据的共性、网络的整体特征隐藏在数据网络中,而网络空间所具有的去中心化和全球可进入性、网络交流的交互性和随时性、互联网的设计结构和包转换机制都使信息难以定向拦截。由于互联网地址和物理地址无法一一对应,因此在网络空间,不仅主权国家难以知晓数据在被跨境传输,就是信息数据传输者本人可能也并不知晓。
第三,国家在数据主权管控与数据跨界流动之间的矛盾取舍。数据的适度开放和跨境流动有助于各国间的友好交流和经济互动,这也是各国积极倡导大数据战略的重要原因。而大数据的独立开放性逐步侵蚀国家主权的有形和无形疆界,使主权国家的地理边疆在数据流动中日渐虚化。随着云技术的推广,数据流动在技术层面得到空前扩展,数据流动速度远远超出了主权国家数据管控技术和制度的更新速度。怎样管控数据跨境流动,既不损害国家主权又不妨碍国际合作,是摆在各国面前的两难问题。
结 语
大数据是一把“双刃剑”,其所蕴含的战略价值已被各国所重视,但国家数据主权又遭受着多重威胁和挑战。当前,我国人口数量全球第一、数据应用市场复杂多变,如此庞大的用户群体使我国成为世界上数据储量最丰富的国家,也使我国数据主权和安全面临巨大的冲击。如何在充分有效运用大数据的同时,捍卫我国的数据主权,是摆在我们面前亟待解决的问题。首先,要构建中国国家数据战略。2015年8月19日国务院常务会议通过了《关于促进大数据发展的行动纲要》,这意味着促进大数据发展正式成为国家行动方略。但辅之以相应的制度安排和法律规范仍需要进一步健全和完善。其次,提高核心数据控制能力。由于西方大国长期掌控互联网的实际管理权,我国应健全大数据综合安全保障体系和提高数据独立性,以此实现对核心数据的控制。再次,要实现数据自由流通与数据跨境管控之间的合理平衡。对于促进国际交往合作的数据应鼓励积极流通、不受限制,而对于危害国家主权、安全,损害个人数据权利的跨境流动要实行严格管控。