本文刊载于《中国科学院院刊》2021年第11期“专题:科技伦理治理的战略研究”,原文标题《构建数字化世界的伦理秩序》
王国豫1,2 梅 宏3,4*
1 复旦大学 哲学学院
2 复旦大学生命医学伦理研究中心
3 高可信软件技术教育部重点实验室(北京大学)
4 北京大数据先进技术研究院
现实世界数字化,构建一个与现实世界平行的数字世界,正在逐渐成为现实。借助于对数字化世界的深度解析,人类不仅拓展了认识世界的视域,而且通过数字技术和实体经济、产业创新的深度融合,释放出了巨大的市场和经济能量。从电商、共享出行、共享教育、网络协作到在线金融……数字技术不仅改变了人们的生活方式,而且改变了人们的思维习惯和模式,改变了社会的发展模式和动力。正因为如此,建设数字中国、发展数字经济、推动各行各业数字化转型已经成为新时代我国建设社会主义现代化强国的战略。
然而,我国与数字化转型相应的数字化社会的法律、伦理和制度体系尚未完全建成,现有的现实世界的制度体系并不能完全涵盖和满足数字社会的要求,因而在一定程度上出现了网络空间和数字世界的伦理失序。因此,在加快数字化建设的当下,构建数字世界的伦理秩序与数字化建设一样,不仅必要,而且非常迫切。
1
数字化世界的历程
数字塑造了我们对世界和人类自己的认知。人类使用数字描述世界由来已久。据研究,涉及数、量、形等观念的原始概念,可以追溯到人类种族最早的时期;而数学概念的雏形,则可以在更古老的生命形态中找到——它们或许比人类还要早数百万年。数的概念的发展是一个漫长的过程。最初的数学直接与我们的感官经验世界相联系,有人甚至认为人类种族的延续跟数学观念的发展或许并非毫不相干。源自古希腊的现代科学预设了宇宙世界的规律性,而这一思想则与毕达哥拉斯学派的“万物皆数”的宇宙观不无关系。“一切可知的事物都有数字;因为,如果没有数字,任何事物都既不可能被构想,也不可能被理解。”
毕达哥拉斯学派提出的数字构想事物的假设,在数字化时代已经得到部分验证。数字化概念出现在 20世纪 50 年代。英语中的“digitize”“digitization”来自拉丁文“digitus”“finger”和英文“digit” “number”,是指将物体、图像、声音、文本或信号转换成数字格式的文件的过程。这场肇始于 20 世纪 50 年代的数字化技术带来了巨大的社会变革。
如果说早期的数字化还仅仅聚焦于物理世界,借助于二进制代码将数据与知识引入计算机内部,以形成可识别、可存储、可计算的数字数据,再据此建立相关的数据模型进行处理分析的话;那么今天,借助于互联网、大数据、人工智能、物联网、云计算等技术的集成创新和融合应用的数字化技术,则将触角延伸到整个经济和社会系统,从物理世界蔓延到人类社会生活世界,逐步实现了对整个社会组织、管理和运行系统及人的数字化。一个人可以用一组数据来表示,一个社会、一个国家同样也可以用一组数据来描述,人和物的身份都可以用数据来表示——数据成了联结万物的基础。在经济生活中,数据成为继自然要素和人工物以外的新的生产力要素,在工业界也有“数字石油”和“数字能源”之称。而对于知识生产来说,数据则成为我们认识世界的本体和知识的新来源。正因为如此,世界各国都在致力于数字化相关的基础建设和转型。
“数码物”(digital object)已经引起哲学家关注。虽然数与物的关系还有待于进一步深入研究,但根据数据的知识论解释,数据是事实的集合,数据可以表征世界。在某种情况下,你的数据甚至比你更了解你自己。在 Bogen 和 Woodward看来,数据就是与某种现象所对应的有待阐释的事实的表征。“只要满足一定的状态,或者当满足一定的状态的时候,相关的事实就可以进行解释,它们(数据)就可以表征相关的事实。”因而,人类对世界的认识转而可以通过对数据的解析而获取,而构建的世界图景在一定意义上取决于数据。图灵奖得主吉姆·格雷(Jim Gray)认为,科学研究已经进入“第四种范式”——数据密集型科学范式。在此范式下,数据不仅成为科学研究的新方法和新路径,而且,与采用演绎方法的知识驱动的科学相比,数据驱动的科学对世界的解释力更强。因为传统方法通常是建立在小数据集或局部数据基础上的,因而只能获得局部片面的知识,缺乏对事物系统、宏观与整体的认识;而基于大数据的科学研究理论上则可以通过对统计规律的解析,寻找普遍性知识,进而从整体上或全局上认识世界。
以精准医学的研究为例:2011 年美国国家科学研究委员会的《迈向精准医学》报告,将精准医学定义为“通过整合每个患者的分子研究和临床数据发展一种更加精确的分子疾病分类的知识网络,以此提升诊断和治疗水平,从而能够根据每个患者的个体差异为其量身定制更好的卫生保健”。因此,生物医学大数据的获取是精准医学的前提。生物医学大数据包括各类组学数据,如基因组、蛋白质组、代谢组、表型组等,以及环境数据和家庭及个人行为数据等;既涉及个体的基因遗传和生活数据,也包括家族、群体和外部环境的数据,还包括社会经济等方面的数据。通过整合、分析这些多维度的数据,从中找出规律,最终获得影响个体健康的全景图像,取得在小数据的情况下不可能获取的知识。从这个意义上讲,数字化不仅从本体论上改变了我们认识世界的基础,也从方法论和认识论上改变了我们认识世界的途径。
2
数字化世界的特征与双重效应
基于对数据是事实的集合或世界的表征这一认知,世界各国、各行各业都在推动数字化转型。将含有某种信息的物变成数字形式,借助于数字技术可以更好、更方便地管理来自不同设备和系统的海量数据,实现跨区域、跨团队的合作,实现知识共享。例如,当医院文件柜中的纸质病历转变为数据存储在云端的时候,那些数据又可以成为人们随时随地用以生产知识或解除疾病的对象物。对于社会生活来说,也许数据是什么并不重要,重要的是这些物的价值的释放。摆脱了“域”的局限,数据作为物的载体在无限的时空中流动。因为服务业的数字化,远道而来的客人可以不必再去一家家旅店询问是否有空床位,或者为了寻找一件商品而跑遍整个城市。在河南郑州“7·20”特大暴雨灾害的危急时刻,一些志愿者通过网上信息传输和协作的方式,不仅让救援者知道哪里最需要人和物,而且在关键时刻,数字化世界和实在世界的有机无缝衔接还创造出拯救生命的奇迹。
然而,一个新世界的诞生必然伴随着初始无序的阵痛。数据是物的载体,而物本身是有限时空中的存在。从物到数据,再从数据到物的双向流动,释放出了巨大的生产力和价值,但也带来了伦理上的诸多挑战。本质性原因在于,数字化将有限时空的人的活动扩展到了没有物理和时间疆界的虚拟空间,而我们现有的各类伦理和社会规范都是针对现实世界确定时空中的人、在特定的社会网络中的人。当网络和数字化空间解构了现有的社会关系网络,虽然人还是社会中的人,但这个社会关系网络变得无形无影。网络和数字化空间的行为可以影响到现实世界的人与社会,但是现实社会的秩序却不能简单地适用于数字化环境。这就带来了数字化世界的伦理失序。数字化世界的伦理失序至少表现在 2 个层面。
个体层面
对于个体而言,个人在数字化世界获得了新的身份——数字身份(digital identity)。数字身份简单地说是指用于描述和证明一个人的一组代码。借助于数字身份,人们可以在数字化世界证明“我是我,你是你”。数字身份不同于电子身份,传统的电子身份仅仅是身份信息的电子版,而数字身份与数字身份技术系统相关——通过引入生物识别技术和大数据等数字化技术给人“画像”,以确认数字“我”和实在“我”是同一个人。常见的有银行系统、铁路和机场交通系统的身份识别或认证。通过身份识别,可以为人们高效、安全地进行金融业务的交易和通行带来极大的方便。疫情中的健康码也是一种数字身份。“绿码”和“红码”不仅勾画出一个人的生活轨迹,还包括他的社交网络。
网上的推送也是基于个人的数字身份:根据行为足迹、在网上的浏览习惯推断和分析某人行为偏好,甚至其职业和工作场所。于是,一个人至少可以得出 3 种身份:① 社会身份;② 生物信息身份;③ 行为和心理的身份。这 3 种身份信息在大部分情况下都属于个人的私人信息,如果其他人需要获取这方面的信息,需要征得本人的同意。但是,在数字化空间,这种“画像”大部分是数字化技术构建的。尤其是关于个人生物信息、内心情感和偏好的推断,属于个人极其敏感的隐私。人类是一种情感动物,也是极其脆弱的动物。个人隐私的不恰当暴露常常会带来对个人和家庭的极大伤害,有时会带来对个人和家庭的出身、健康、种族与性别的歧视。
个人情感属于人的隐私,保护隐私也是为了保护人的尊严和自由;然而,数字化世界几乎没有隐私。在网络和智能时代,只要上了网就等于进入了公共领域。这在某种程度上是网络世界的逻辑所决定的。目前,我们还没有足够的技术与规范来构筑对个人的完全的保护。2018 年 11 月 9 日,Erlich等在 Science 上发文称,通过使用远亲和其他人口统计信息,而无需特别具体的信息,便可以相对容易地在数据库中追溯到某人的身份,如目标的年龄或可能的居住地;在理论上只需要大约 2% 成年人在数据库提交 DNA 信息,就可以追踪到任何人的远亲,进而揭露他们的身份。类似个人生物信息的暴露不仅可能改变一个人的生活现状,还可能影响到其未来甚至其子女的生活。
数据的“脱域”使得其权属不明确,因此一旦产生价值,便可能产生价值分配的冲突。数据的生产者和数据的供给者都可以提出自己的权利诉求。如果发生了数据转移和数据共享,那么,就不仅涉及知识产权和利益分配问题,还涉及知情同意问题。特别是生物医学数据(如基因数据)不仅涉及个人的隐私,还可能涉及群体的隐私。谁有权获取、谁有权同意和分享,这些不仅涉及数据的分配伦理,而且涉及对数据的支配权和自主权。
私人信息被数据化进而转化为社会记忆后,其作用之正面或负面未尝可知。人是一种会遗忘的生物。人的遗忘是常态,而对于人工物来说,一般不被删除或破坏,信息就会永远保存。今天我们可以了解到先人的文明程度,“断代”和“断源”常常更主要是依靠物的“记忆”。然而,遗忘虽然是人类的“缺陷”,却也是人类向前的必要前提。没有遗忘的人,其生活将会变得非常沉重。舍恩伯格在《删除:大数据取舍之道》一文中讲了一个故事。2006 年的某一天,生活在加拿大温哥华的 60 多岁的心理咨询师菲尔德玛,打算通过美国与加拿大的边境,就像曾经上百次做过的那样;但是,这一次边境卫兵用互联网搜索引擎查询了一下菲尔德玛,搜索结果中显示出菲尔德玛在 2001 年为一本交叉学科杂志所写的文章中提到,其在 20 世纪 60 年代曾服用过致幻剂 LST,因此菲尔德玛被扣留了 4 个小时。期间,菲尔德玛被采了指纹之后还签署了一份声明,内容是他在大约 40 年前曾服用过致幻剂,而且以后将不再进入美国境内。由此可见,在数字化世界,一旦私人信息被数据化进而转化为社会记忆,那么带来的有可能不是自由,而是包袱和控制。这也是为什么在“文明码”刚一出台的时候,就有学者竭力反对的重要理由。
社会层面
数字化对社会的影响是多元的、全方位的。
1.数字化释放了巨大的生产力。大数据的采集、分析、应用进一步改变了生产模式和消费方式,并以此不断促进产业升级和发展。数据已经成为继自然资源和货币资本之后的核心生产要素。借助于数字化工具对生产与物资调配信息的及时收集与分析,可以使得各产业链、供应链上下游之间迅速完成信息交换,及时调整产销结构,合理配置资源。生产模式也变得多元化和灵活。消费方式的线上转移,为商品供应者了解消费者的实际消费需求和消费偏好,以及实施个性化的服务提供数据。
2.数字化在社会生活方面,包括在医疗、养老、教育和社会治理等方面都带来了巨大的改变。远程医疗和数字影像可以为远在山区的民众就医问诊,远程监护不仅可以及时帮助孤独老人解决生活问题,还可以通过视频聊天弥补老人对儿女的思念之情。而对于交通困难的山村教育来讲,数字化有可能让山区的孩子也享受到优质的教育资源,在一定程度上缓解城乡教育资源配给的不平衡。
数字化必然带来社会结构的改变,包括社会的就业结构、城乡结构、区域结构、组织结构、社会阶层和权力结构的改变。这些改变将是牵一发而动全局的事情:对于一个家庭来说,一个人的失业可能会影响全家;对于一个社会来说,大批的失业将会带来巨大的社会动荡。每一次转型首先受到冲击的必然是社会的弱势群体。那些简单的重复性劳动将是最先被替代的劳动——在工厂的流水线上已经不需要“卓别林式”的工人;实体商店的被取代意味着大量的售货员将不再被需要;无人驾驶的汽车将会在不久的将来淘汰出租车司机,银行的出纳也不再被需要——电子货币正在取代货币在网络市场上流通;医院的护士、饭店里的服务员都可能将逐渐被机器人取代。如果没有及时的就业指导和培训,社会阶层将会依据是否具备或掌握了多少数字化技能而划分。谁掌握了数据,谁就掌握了权力:一边是通过集聚海量数据而崛起的精英群体,另一边则是被数字技术取代的“数字穷人”。数字化将带来劳动的“无人化”、贫富差距和数字鸿沟的扩大化,而最终凸显的是数据的无情甚至绝情。
对于数据驱动的科学研究来说,数字化的影响更是巨大的。科学技术领域也是最早开始了数字化转型的领域。今天无论是在物理学、天文学、生物学还是在生态环境科学领域,大数据都已经是科学研究的重要手段;甚至在传统的人文与社会科学,在历史学、图书馆学和文学艺术领域,数字化都打开了新的天地。科学技术数据的生产就像人造物的生产一样,也是一个由人与技术共同作用的过程。数据可能来自各种不同的渠道(特别是通过互联网收集的),其可靠性本身就需要检验;信息和知识只有通过复杂的数据挖掘和分析过程才能获得。因此,数据计算,包括高性能计算、超大数据存储系统、快速高效的数据收集和分析软件等数据生产加工的基础设施和工具的性能也影响着数据的质量。这些技术本身处于一个不断更新迭代的过程中。而数据的真实性、有效性首先取决于这些数据技术的可靠性和精确性。数据质量差(包括不完整的数据、错误或不合适的数据、陈旧的数据或在错误的上下文中使用的数据)不仅会限制系统的学习能力,还可能对未来的推断和决策产生潜在的负面影响。Ormond 和 Cho指出,大规模 DNA 测序产生的伦理问题本质上不同于那些医学遗传学中产生的问题,部分因为全基因组或外显子组测序产生的庞大的数据量增加了大量“未知意义的变式”,这些“未知的未知”(unknown unknowns)被当前不成熟的技术、分析有效性的共同标准的缺乏、不同的测量平台及不完整的或不恰当的引用数据库等放大。
数据生产也离不开人,而且不止一个人,是多人协作的结果。特别是该领域的带头人,其诚实可信和严谨作风不仅影响着其生产的数据,而且有可能改变整个行业的方向,对社会产生极大的影响。据美国《纽约时报》2018 年 10 月 15 日报道,曾在哈佛医学院工作的著名心脏病专家皮耶罗(Piero Anversa)博士曾在 31 篇论文研究中伪造和篡改实验数据,其中第一篇论文发表于 2001 年。皮耶罗的研究声称,使用干细胞可以令受损心肌再生。尽管其他实验室纷纷表示无法复制其研究,但他的研究工作仍促成了数个初创企业的成立,使得众人投入研发治疗心脏病和中风的新方法;而美国国立卫生研究院(NIH)更是注入资金,供其做临床实验。最后,因为皮耶罗作为学术权威提供的虚假数据和成果,从而带来了整个领域大量公共资金和无数科研人员时间和精力的巨大浪费。
数字化为社会治理和全球治理提供了新的工具。始于 2019 年底的新冠肺炎疫情对社会治理带来了极大的挑战,能否及时控制疫情关系到人民的生命财产安全。在这场与新冠病毒争夺时间和生命的比赛中,大数据和数字化技术发挥了重要的作用,可以说功不可没。虽然世界各国数字化的程度和水平,以及对其应用的边界的态度有很大的差异,但是几乎全世界都在使用数字化技术跟踪和检测病毒,以及控制疫情的发展。
但是,数字化也可能对社会乃至国家层面带来安全问题。数字化转型与数字共享是相伴而生的。网络世界几乎是没有国界的;数字一旦进入云端,即便不想共享,有时候也会面临黑客的攻击。攻击者可以通过分析参数或查询模型,从训练数据集中推断出潜在的敏感信息。此外,有些安全问题并不能马上被意识到,如涉及合成生物学的研究成果和生物、生态数据的发表。虽然知识生产具有公共性,但是有些数据特别是生物信息和涉及国家安全的数据的公开发表,一旦被恐怖分子掌握,就有可能威胁国家和人类的安全。
3
如何构建数字世界的伦理秩序?
数字化所带来的伦理问题早已在国际国内引起广泛注意。构建新的数字和网络空间的伦理秩序,在促进数字化转型和数字化技术发展的同时,保证数字空间高效、有序的发展,是一个迫切但并非容易的过程,需要不断从理论和实践两方面探索。
理论层面
从理论上来说,科技伦理学正在从 3 个方面介入数字化的进程。
1
延续科技伦理学的批判性反思传统,揭示数字化是一种将“信息流”看作是“最高价值”的“数据主义”
这种新的意识形态的本质是将宇宙看作“是由数据流组成的,任何现象或实体的价值都取决于它对数据处理的贡献”,同时“把整个人类物种解释为一个单一的数据处理系统,每个人都是它的芯片”。在这一批判性范式的引导下,对“数据主义”的冷漠无情和反民主、内卷化的批判,成为当下人文主义介入数字化的主潮流。当数据和算法连同资本一起,在一定程度上已经成为主宰人类生活的权力,并将个体和社会不知不觉地带入“算法困境”的时候,这一批判无疑起到了“恐惧的启迪”的作用——提醒人们数据虽然可以成为生活世界的镜像,但数据是抽象的,而生活世界是丰富多彩的。数据背后的人是有血有肉的,数字化还得有“温度”。
2
从理论走向实践,主张哲学介入设计,伦理可以“嵌入”算法
荷兰学派的“道德物化”理论代表了这一方向,主要体现在将道德的理念通过设计嵌入到物或计算系统中。包括数据审计识别技术、加密技术和密钥管理技术、安全多方计算技术在内的各种数据保护技术的开发,都希望通过数据清洗、数据屏蔽、数据交换、数据泛化、随机干扰等数据扰乱技术来进入到对伦理的调节之中,这种调节可实现对个人隐私的保护。而在大数据和智能技术业内流行的隐私计算、公平计算等也可以看作是这方面的实践,其目的都是在追求通过算法实现保护隐私和公平公正,这显然是一条非常重要的路径,但是却让技术人员承担了他们单独难以承担的伦理之重。
3
塑造行动者网络,主张将负责任创新贯穿于从研发到市场的全过程
该理论主要是强调“负责任研究和创新是一个透明交互的过程;在这一过程中,社会参与者和创新者彼此相互交流、反馈,充分考虑创新过程及其市场产品的(伦理)可接受性、可持续性和社会可期待性(desirability),使科学技术进展适当地嵌入到我们的社会中”。负责任创新包括 4 个维度:预测(anticipation)、反思(reflexivity)、协商(inclusion)和响应(responsiveness)。它的特点是打通了从研发到企业创新,以及和公众的对话。欧盟从 2013 年开始就在提倡和宣传这一理念,并且以此指导欧盟各国的科技创新。这可能也是欧盟最早提出号称“史上最严”的《通用数据保护法》(GDPR)的原因之一。
实践层面
在实践层面,各国都在加快建设数据保护法律法规。在我国,一个从国家大法到企业和行业规范的数据精准治理的网络正在不断完善,并已经成为现代国家治理体系中的重要环节。一个从现实世界延伸到虚拟世界的“天罗地网”正在逐步形成中。
我国在个人数据和信息保护方面的法制建设工作一直在稳步推进。2021 年 8 月 20 日第十三届全国人民代表大会常务委员会第三十次会议通过的《中华人民共和国个人信息保护法》已于 2021 年 11 月 1日正式生效,它将与 2021 年 6 月 10 日第十三届全国人民代表大会常务委员会第二十九次会议通过的《中华人民共和国数据安全法》和 2016 年 11 月 7 日经第十二届全国人大常委会第 24 次会议通过的《中华人民共和国网络安全法》一起,构成我国数字化时代数据和网络安全治理的基石。这 3 部法律与 2020 年 5 月 28 日第十三届全国人民代表大会第三次会议通过《中华人民共和国民法典》从不同角度和层级规范了从数据开发利用到个人信息处理与网络安全审查的活动。
除了国家层面的法律正在逐步完善以外,企业和行业也发布了不同的保障数据安全的行业准则和规范标准。国家互联网信息办公室、公安部、工业和信息化部、全国信息安全标准化技术委员会等部门也已发布了一系列行政管理办法,如《数据安全管理办法(征求意见稿)》《个人信息安全出境评估办法(征求意见稿)》《网络安全等级保护条例(征求意见稿)》《APP 违法违规收集使用个人信息自评估指南》等,进一步明确网络运营者应当参照国家有关标准,采用数据分类、备份、加密等措施加强对个人信息和重要数据保护。《网络安全等级保护条例(征求意见稿)》还将网络安全等级分为 5 级;要求网络运营者在规划设计阶段即必须确定网络的安全保护等级;要求 App 运营者对其收集使用个人信息的情况进行自查自纠。
但是值得注意的是,数字化的伦理问题不是全部依靠法律、法规可以解决的。法律不等于伦理,法律也不能替代伦理的作用。法律是伦理的底线;而数字化转型中的伦理问题很多是属于多元价值下的规范和规则冲突。并非所有的冲突都可以通过诉诸法律解决。有些问题很大程度上属于公众的接受性和技术的规范要求在时间和空间上的错位,属于不同价值群体之间的价值冲突。因此,除了上述法律法规和行业规范、企业自律和工程师负责任以外,塑造数字化世界的伦理秩序还有一个重要的方面——提高数字化时代民众参与数字化转型和治理的能力。要像花大力气建设数字化基础设施那样,提升数字化时代公众的数字化素养和能力,包括:理解和使用数字技术的能力,参与建设和分享数字化转型红利的能力,识别数字化交往中的各类风险的能力,以及依法依规保护个人信息安全和数字权益的能力。真正让广大的人民能够共建共治共享数字化世界和数字化社会的新格局。数字化不是目的,数字化经济也不是目的,让全社会共享数字化转型的福祉才应该是数字化真正的宗旨。为此,必须将教育、培训、转岗,以及提升个人的“数能”纳入数字化转型时期的基础建设实施框架;要引导人们树立风险意识,提高伦理风险敏感性。
数字化与全球化相辅相成,相得益彰。国家主席习近平在二十国集团(G20)领导人第十四次峰会上指出,当前,数字经济发展日新月异,深刻重塑世界经济和人类社会面貌。我们要营造公平、公正、非歧视的市场环境,不能关起门来搞发展,更不能人为干扰市场;要共同完善数据治理规则,确保数据的安全有序利用。面对世界百年未有之大变局,数字化世界的伦理治理更需要包括政府、企业与社会组织在内的国际社会的互相信任与合作。数字化世界伦理秩序的建构一定离不开全球协作。
王国豫 复旦大学哲学学院教授、博士生导师,复旦大学生命医学伦理研究中心、应用伦理学研究中心主任。中国自然辩证法研究会科技与工程伦理专业委员会副理事长,上海市自然辩证法研究会理事长,上海国家新一代人工智能创新发展试验区专家咨询委员会委员,中国计算机学会职业伦理与学术道德委员会共同主席。主要从事应用伦理学和科技伦理、科技哲学的研究。
梅 宏 中国科学院院士,发展中国家科学院院士,欧洲科学院外籍院士,电气和电子工程师学会(IEEE)会士。高可信软件技术教育部重点实验室(北京大学)主任、教授。北京大数据先进技术研究院理事长,中国计算机学会理事长。主要从事软件工程和系统软件领域的研究。
文章源自:
王国豫,梅宏.构建数字化世界的伦理秩序.中国科学院院刊,2021,36(11):1278-1287.
DOI:10.16418/j.issn.1000-3045.20211106001
总监制:杨柳春
责任编辑:张帆
助理编辑、校对:PAN
排版:百里