社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
新兴领域

【岳瑨】大数据技术的道德意义与伦理挑战

 

“大数据时代”已经来临。①互联网、移动互联网、物联网、云计算、各种个人智能终端,带来了前所未有的挑战和机遇。数据挖掘方兴未艾,它既是企业竞争力的来源,也是国家竞争力的重要组成部分。大数据技术在应对复杂性、洞察形势、做出合理决策等方面,展现了无与伦比的优势,开拓出令人意想不到的可能性。与此同时,它在信息安全、身份盗用、数字鸿沟、数据污染、隐私侵害和新的垄断等方面,也带来了一些新的令人困扰的伦理问题。与大数据同行,伦理之间必不可少:大数据技术内含着怎样的文明指引和道德意义?它带来了哪些重要的伦理挑战?

一、技术的文明指引功能与道德意义

目前流行的“大数据技术”是基于大规模生产、分享和应用数据的互联网平台,特别是基于移动互联网、云计算等网络平台,发掘数据价值的一种新形态的数据挖掘技术。医疗大数据开创了将数字化世界渗入医疗的超级融合进程。它在数字化人体的基础上解开疾病的根源,使得对个体特征和个人生命性状的绝对尊重的诊断和治疗成为可能。②教育大数据打开了一扇伴随大数据学习或更好地利用大数据适应学习的自我矫正的教育之门。③它正在改变学校教育的结构和形态,赋予它以一种全新的道德内涵。

如果用“n”代表某个项目的人数,“n”为“1”时是最小的人类样本,那么在大数据时代的社会生产和生活中,无论中介机构、金融、电信、交通,还是政治、经济、法律,包括医疗和教育在内的一切人类活动领域中的最小行动者,一定是“这一个”处于互联网或移动互联网的终端上。④无数个体的网域实践产生了海量数据之汇聚。我们设想当“n”以万计,千万计,甚至以亿计时,大规模行动者提供的数据之“大”,当然会令个体仿佛处于数据世界的汪洋大海之中。人们会感到无所适从。幸运的是,新的超级计算或云计算的出现,为人们提供了数据之海的“航海图”,进而提供了规范个体行动者行动的总体参照系。这就是在各个层次上由大数据技术开拓的数据挖掘的“文明指引”。一旦“文明指引”通过云计算被揭示出来且用于指导个体行动者的行动,道德价值和社会法则就会“具形化”于大数据技术展现的物质形式和文明形态之中。从这一意义上看,如果说数据挖掘技术带来了数据驱动型社会的降临,那么它的驱动力结构体现的文明指引功能,就必然展现为一个“道德形态过程”⑤。

在大数据驱动下,数据挖掘技术产生的“文明指引”范导个体行为和社会法则趋向道德合理化目标。网上书城会根据购书者的已购书目和浏览的相关数据分析,提供相应的可选书单。店商会依据大数据提供的相关度分析确定商店的地址并安排商品位置,以更好地服务于消费者的购物意愿。公司会通过数据挖掘的方法确定特定顾客的购物意向,从而将相关产品的优惠或折扣进行配送。假冒伪劣商品会在第一时间被识别出来并被下架。生产企业会更加重视它的上下游供应商和经销商的信誉和企业社会责任对于合作关系的重要性。教师会根据有效学习的总体分布针对个体学生提供“一对一”的指导。公益慈善机构会成为高效化雪中送炭的有组织的慈善责任主体。中介机构会更加重视声誉和信任。个人信用体系会更加完善。违法行为或不道德行为会受到更为严格有效的预防或监控。公共产品、服务和制度设计会更多地体现伦理秩序的内在要求和程序伦理的约束。大数据算法通过对社会益品的配置使见义勇为者、助人为乐者、诚实守信者、勤奋工作者的行为获得更多的激励。个人可以通过大数据发现与己相关的外溢性外部环境,这种正相关将为个人价值实现提供正面引导。社会因此趋向于从更长远目标和更适度节奏上进行道德合理化的关联性构建。

大数据驱动开启的文明指引,将最小行动者与最大数据计算的总体参照之间进行连接,展现了技术的文明指引功能所内蕴的道德意义。各种类型的“互联网+”面向教育、培训、金融、医疗、社交、社区管理、旅游、城乡规划、政务平台和政府管理等广阔的实践领域,扩展了或正在扩展着数据挖掘或数据驱动的文明指引功能,将个人快速便捷地融合到一个共享的总体性数据平台上。个人不再是孤立无援的个体,他或她时刻与他人或环境可以结成一种休戚与共的关联整体。这使得大数据技术与以往一切技术都有着本质性区别。它不再是作为一种无批判的技术背景如汽车、空调、冰箱等隐蔽地支配人的生活,而是作为一种融合文明指引功能的道德前景将价值反馈或批判的正面能量即时汇聚,纳入相关关系的计算之中,使社会富于活力,更加自由开放,兼顾公平与效率,从而引领并推动人类道德的发展。

二、连接“是”与“应该”的桥梁

从技术现象学的视角看,大数据技术的道德意义与它重新激活了技术意向性的课题密切相关。数据挖掘技术是一种能够最大限度地汇聚主观性因素的规范化程序和计算方法。它在驱动人们处理复杂事件、捕捉在线数据、研发更佳产品和服务,以及做出更佳决策的能力方面,带来了巨大的进步。⑥进而,它引发一场革命性的重构,即通过将“是”与“应该”连接起来,使伦理思考方式不再仅仅是技术展现的伴随现象,或者不再仅仅定位为对“技术之是”进行批判的“应该”。它成为与技术展现相契合的文明进程,是技术“道德化”的形态表征。大数据认知及其“技术展现”至少内含五种道德意义。

第一,增进整体人类福利。人类利用数据改善生产、交往和生活方式的历史是一部文明的进步史,也是增进社会总净值的道德发展史。大数据的规模性(volume)、多样性(variety)、高速性(velocity)和价值性(value)的特点,使得它能够最大限度地面向整体人类福利。这种新的数据获取、分析、处理、共享和应用的平台型技术范式和数据资源,最大限度地降低了信息搜索成本,提升了人类实践活动中资源匹配的效率,扩展了整体福利或公共利益的外部性。⑦它也为组织内部的信息管理、激励约束机制、治理环境的改善提供了极大便利。贾斯汀·肯通过对英国卫生保健领域大数据应用前景的分析指出,卫生服务领域已经具备了大量、完整的信息,这些信息向第三方开放会带来巨大收益。⑧大数据面向整体或全样本的数据挖掘或计算方法,有可能攻克道德发展面临的功利主义难题,即如何计算“最大多数人的最大幸福”的难题。

第二,推进社会优先构建“公共善”。当前中国道德发展面临各种道德突出问题。“老人摔倒该不该扶”成了拷问公众良心的话题之一。在治理进路上,社会对“公共善”的构建是问题的关键。⑨在这方面,大数据展现了广阔的应用前景。大数据技术通过挖掘当前老龄人口中享有医疗保险和养老保险的人口比例以及传统家庭养老模式在独生子女时代面临的社会压力方面的数据,可分析“老人摔倒后为何反诬救助人”的行为相关要素,帮助人们洞察道德突出问题的症结所在。公平正义的制度环境能涵养道德,积聚人心向善的正能量。借助大数据技术,尤其是通过对大规模时间序列数据的实时获取,国家(依据养老保险和医疗保险的大数据)可以从公共政策层面化解“救助他人”的道德风险,公安部门(依据犯罪大数据)可进行稀缺警力配置,城市管理者(利用人口流动的大数据)能更精准备地预防突发事件的发生,河道管理部门(通过渔业大数据)会更有效地监测并维护稀缺物种的生态权益,银行(利用金融大数据)会有效地防范或规避金融道德风险。大数据在提高政策描述和强化政策预测功能方面有助于推进或增进社会对公共善的构建,为针对道德冷漠现象、有组织的不负责行为、社会诚信、环境问题等治理提供一种计算社会科学的资源性支持,有助于增进社会从公共政策层面对公共善的构建。

第三,展现开放共享的伦理。大数据伦理面对的最大难题,是数据的互联互通和开放共享。大数据技术应用的前提是突破单一数据来源,以应对复杂的公共性课题。事实上,任何一种有效的公共治理和复杂的人类行为预测,都需要平行使用多个大型数据库,因而是通过大数据技术展现一种开放共享的伦理理念。如反恐合作、紧急救援、大规模疫情应对、全球金融危机分析、国际性的社会运动预测、全局性经济衰退的影响评估等等,都需要开放共享的大数据平台的支持。然而,自2012年世界经济论坛宣布大数据成为一种新的经济资产开始,一些组织(如一些移动网络公司和政府机构)纷纷把大数据看作是类似于黄金或货币一样的资产。一些国家也将信息安全上升到国家利益的高度。这产生了令伦理学家困扰不已的问题。牛津大学的卢西亚诺·弗洛里迪教授认为,“人类必须改善现有的社会运营体系,才能充分利用大数据”⑩。一方面,政府需要建立合法程序和合理规制框架,在程序伦理方面有积极的作为和正确的导向,通过创建平台,引导数据开放,平衡信息安全和信息开放之间的张力。另一方面,那些掌握大数据的企业需要建立数据交换体系并让数据交换正常化,在实质伦理方面,它们有责任把数据的价值扩展到更广泛的人群。国家、企业和个人都需要应对大数据开放共享的伦理趋向,前瞻性地看到大数据技术展现的道德前景。

第四,体现尊重差异的价值。由大规模样本获得的针对整体的结论是否适合于个体?大数据技术唯有体现“尊重个体差异的价值”才能解决这个问题。由于大数据背景下个体历史数据的搜集和保留成为可能,建立以个体为中心或尊重个体差异的大数据伦理是必要的。网上商城根据用户的历史搜索与查看数据,能够针对个体偏好比较准确地提供推荐商品。移动网络公司则能够根据个体起床时的心情指数推荐唤醒铃声。大数据使人们看到,世界远比人们想象的复杂、细致和不确定,而个体历史的保留则使大数据描述和预测在拥有整体视角的同时又能够尊重个体差异,因而找到应对复杂性的最佳方案。另一方面,在伦理的技术化实现方面,大数据技术将尊重差异的价值体现在“平台型”思维和网络平台的构建之中。从互联网数据平台看,电子商务、搜索引擎、众筹、在线教育等,是将贴近用户、尊重差异的伦理理念技术化的一种大数据平台构建。网络医疗平台为患者提供在线咨询、预约挂号服务。当个体医疗数据集聚到一定规模,它就会通过数据搜集扩展为“个人化医疗”信息体系,并在两者之间建立良性循环。这使平台构建能够迅速地扩展成为一种伦理构建,体现“得账户者赢”、“得人口者得天下”的道义逻辑。伦理融入大数据技术,或者道德技术化为产品和服务,是互联网企业“用道德赚钱”的秘密。它的前提是,通过平台思路,充分体现尊重差异的价值,以构造更包容、更宽广的数据平台。

第五,在道德知识与道德行为之间架设相通的桥梁。大数据技术内蕴知行合一的价值图式,它鼓励自由、参与、共享、自律、互助、平等、双赢、诚信、独立等积极的行为规范。随着数据抓取能力的增强和处理复杂网络的分析软件的出现,大数据技术能够直接将知识转化为行动,在集体行动、政治选举、公益慈善、公共传播等社会网络构建方面变得更细致、更富于行动力和预测力。人们从事一项有益的事业,如救助失学儿童、保护生态环境、从事义工、救助动物、参与或发起一项募捐等,都不是从因果关系衡量其重要性,而是从相关关系界定个人行为与整体命运之间的关系。以“扶贫”为例,大数据并不构造道德知识以谴责为富不仁的行为,而是通过给出贫困人口的生活图景、分布、现状、需求以及扶贫故事和案例,特别是通过互助对特定人口或地区之命运改变的历史记录及可视化情景再现等多样化的数据,为人们进行相关关系的挖掘提供具有重要价值指引。它的优势在于,通过微信、微博等平台,使数据转发、留言或评论形成一种层层放大的具有行动导向的感召力。参与者越多,它的价值就愈大,就越是对参与者有利,从而吸引更多的参与者加入。这种大数据行为的“正循环模式”,是基于数据行为的自愿性和普遍化对其价值内核进行凝练,适时内爆为海量数据汇聚。如果把互联网比作由无数河流所构成的网络,那么数据就是“河水”。它流向何方?在何处汇聚?如何冲破万水千山汇入大江大海?道不远人。大数据的“大道之行”本质上是人类行为之事实与价值的融合。在数据驱动的深层,道德知识与道德行为得以联通。数据挖掘因此可望破解“有道德知识而无道德行动”的知行难题。不论就其描述性功能而言,还是就其预测性功能而言,它通过“知行合一”或“即知即行”的大数据行为,汇聚、改善和提升人们的道德相关行为。

三、大数据技术面临的伦理问题

大数据技术是物的数据化与数据的物化的统一。物的数据化是指让数据发声以说明世界,数据的物化是指通过挖掘相关关系以改变世界。两方面相互依存、不可分割,体现了大数据技术在描述和预测中带来价值图式、文明指引和道德前景的变化。与大数据技术内含的道德意义相关,它面临的伦理问题可归结为如下五个方面。

()在增进整体人类福利时如何缩小数字鸿沟?

“数字鸿沟(Digital Divide)”指不同群体对于信息技术使用的巨大差异。基于对“使用差异”的不同理解,数字鸿沟有四种:(1)可及——不同群体或个人在获取技术以及在信息可及方面存在的技术鸿沟;(2)应用——不同群体或个人在通过互联网获取资源方面存在的应用鸿沟;(3)知识——不同群体或个人在通过互联网获取知识方面存在的知识鸿沟;(4)价值——使用者因自身价值观方面的原因导致的在运用大数据方面存在的深层次数字鸿沟。在大数据时代,随着移动互联网和云计算的普及,“鸿沟”及由此导致的公平正义问题不再主要地集中于技术接人或信息接入方面,可及、应用和知识方面的鸿沟正在缩小,而价值鸿沟则变得日益凸显。由于数字鸿沟的概念涉及在信息技术以及有关的服务、通讯和信息可及等方面的失衡关系,它会在全球、各国或各地区贫富之间、男女之间、受教育与未受教育的人群之间导致信息可及、资源应用、知识获取和价值区隔等方面的不平等和不公平。(11)“鸿沟”只能逐步缩小,但仍将长期存在。而如何缩小“价值鸿沟”会变得越来越突出,也越来越重要。这是大数据技术面临的一个世界性和人类性的价值伦理学难题。

()在促进公共善时如何防范数据失信和数据失真?

由于大数据使量化世界成为可能,自然、社会、人类的一切状态和行为都可转化为数据而被记录、存储和传播,因而形成了与实体化的物理足迹相对应的“幽灵化”的数据足迹。它带来的潜在伦理风险是“无法摆脱的过去”对人之生存的压迫。如果人们担心“数据足迹”对个人职业生涯和未来生活造成不利影响,就有可能采取隐瞒、不提供或提供虚假数据来“玩弄数据系统”(12)。如果一个社会的信任资源状况不佳,玩弄数据系统的行为就会变得非常普遍。大数据面临精准性、可信度、无污染三大挑战。这使得大数据技术在公共善的层面上面临信任悖论,即预设为可信的数据资源变得不可信。因此,治理或防范数据失信和失真,包括治理数据污染或“清洗”脏的数据、不可信的数据和虚假数据等,将是大数据技术面临的公共伦理学难题。

()在展现开放共享的伦理时如何保护个人隐私和安全?

在文化、教育、经济、政治、医疗、社会等诸领域运用大数据,必须在互信和共享的环境中进行。大数据技术在这一维度带来了个人隐私的泄露和保护的伦理问题。学校利用数据平台收集和分析某个学生的敏感信息是否侵犯个人隐私?政府机构或企业对个人信息进行收集、监控和分析处理是否符合隐私规则?医疗数据、商业数据、科研数据甚至个人日常生活中产生的数据等等,面临同样的问题。英国学者帕克用“全民监控”一词来描绘大数据时代的安全与隐私困境。(13)国际上第一本《大数据伦理学》将隐私规则面临的挑战看作是大数据伦理学的核心问题。(14)我国学者邱仁宗(15)、吕耀怀(16)、段伟文(17)等人的研究也表明,大数据技术带来了对个人隐私保护及对个别组织滥用或垄断数据的担忧。对庞大的数据进行实时和准实时的分析对一种新型职业即“算法专家”的职业道德提出了很高的要求。“算法专家”既可以促进公众对大数据会得到正确且适当应用的信任也可以导致公众的不信任,既可以剔除害群之马也可以成为害群之马。在大数据时代,政府、公司、算法专家是时代的“牧首”,他们既可观察“羊群”,也可观察其中“某一只羊”。个人隐私在大数据的“聚光灯”下会无所遁形。大数据时代是否需要重构与之相应的保护个人隐私和安全的伦理?这是大数据技术面临的日益敏感的隐私伦理学难题。

()在体现尊重差异的价值时如何从“多”和“杂”中挖掘“好”?

大数据技术的独特性是从因果关系到相关关系的关注方式的转换。它所蕴含的“尊重差异的价值”体现在“更多、更杂、更好”的口号中。(18)在相关关系维度扩展价值空间的独特性和优势,带来了价值图式的转变。当大数据这种“愈用愈多”、“愈多愈好”的资源,被用于各种不同的用途时,它的使用价值与土地、材料等资源相比显示出一种新的价值特性,即“伦理性”。它更多地体现在相关关系层面将个别结合为普遍、将个体结合成整体、将“我”结合成“我们”。由于这种通过相关关系发现事物普遍本质的伦理性,大数据就具有了“伦理资源”的特性。其伦理性价值图式嵌入了一种良性驱动原则:数据只有为更多的人和人类造福,才会为更多的人和人类所用,它的价值才会因使用而变得更“大”、更“杂”,而大数据技术才可能从更多、更杂中挖掘出更“好”。大数据的优势要得到发挥,就必须认真看待数据背后的人性、人道和人的尊严,以及它所蕴含的个体和整体的关系。大数据所描绘的相关关系归根到底体现的是人与人之间的相关关系。它要以良好的伦理关系为基础,才能挖掘“更好”的相关关系。大数据改变的不仅仅是技术形态,当文字、图像、方位、沟通,包括世间万物,都汇成“数据的河流”,其通向“更好”目标的文明指引功能指向一种与技术形态相关联的道德形态的改变。那么,问题的关键在于,大数据如何才能摆脱冰冷的数字化生存?这是大数据技术面临的从“更多”、“更杂”中找到“更好”的一种总体性的实践伦理学难题。

()在融合“知—行”时如何避免“自然主义谬误”?

大数据的行动导向特征,蕴含从“是”向“应该”、从事实向价值的上升。在大数据背景下,数据不仅仅是具有符号价值的资源,它还是具有经济价值、科学价值、政治价值等多种价值属性的资源。大数据本身嵌入了自由、开放、共享、关联、互动的价值理念,具备冲破数据阻隔、摆脱数据孤岛、让数据造福人类的道德冲动力。然而,发挥大数据技术的文明指引功能必须以承诺“是”和“应该”的异质性为前提,避免“自然主义谬误”。然而,“异质性”一旦被大数据淹没,“是”与“应该”的同谋是否会将人们带向“平庸之恶”?它如何避免有组织的不负责任?在这个意义上,大数据行动的推理不可避免地遭遇“数据暴力”。这是大数据技术面临的“自然主义谬误”的元伦理学难题。

四、结论

大数据技术能否摆脱以科学技术之名或在科学技术的伪装下实施的不道德行为甚至可能犯下的罪行?这是大数据技术内含的道德含义及其面临的伦理难题的首要关切。美国科学史家乔治·萨顿写道:“技术专家可以如此深深地沉浸在他的问题之中,以至于世界上其他的事情在他的眼里已不复存在,而且他的人情味也可能枯萎消亡。于是,在他心中可能滋长出一种新的激进主义:平静、冷漠,然而是可怕的。……如果不经过人性改正和平衡,技术激进主义将埋葬文明,并使文明反过来反对自己,甭管最后剩下的是什么。”(19)令人感到一丝宽慰的是,当今大数据技术对“相关关系”的挖掘实际上预告了摆脱技术激进主义困境的出路。它带来了一种具有文明引领作用的技术范式的革新,即,把最小行动者的个体(包括技术专家在内)与文明总体性的“大道”相连,使其创新、研发和应用符合有益于“人类整体福利”或“公共善”之目的,因而使有关人的活动或人类行为的科学建立在人性科学或道德科学的基础上。然而,大数据技术在彰显一种道德意义时,也面临各种伦理问题。要使大数据的文明指引保持在良性循环的正面效应上,我们就要认真地对待大数据技术带来的伦理挑战。

【注释】

[]迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2013年版第1页。

②美国学者埃里克·托普所说的“超级融合”是“数字化世界渗入医学之茧”的过程。参见[]托普:《颠覆医疗:大数据时代的个人健康革命》,张南等译,电子工业出版社2014年版第279-281页。

[]迈尔-舍恩伯格、库克耶:《与大数据同行——学习与教育的未来》,赵中建等译,华东师范大学出版社2015年版第61页。

[]托普:《颠覆医疗:大数据时代的个人健康革命》,第282-284页。

⑤田海平:《中国生命伦理学认知旨趣的拓展》,载《中国高校社会科学》2015年第5期。

Rayport Jeffrey,"What Big Data Needs:A Code of Ethical Practices",MIT Technology Review,http://www.technologyreview.com/news/424104/what-big-data-needs-a-code-of-ethical-practices/[2011].

⑦“外部性”是经济学中的一个重要概念。大数据使网络外部性与社会总净值直接关联。连接到网络大数据的价值取决于已经连接的其他人的数量。在经济行为中,每个用户从使用某产品中得到的效用,与用户的总数量有关。用的人越多,每个人的效用就越高。因此,在大数据条件下每个使用者的价值被网络平台中其他人的数量所影响。用户数量的增长,带来用户总所得效用的平方级增长。这是大数据扩展公共利益的独有方式。

Justin Keen et al.,"Big Data+Politics=Open Data.The Case of Health Care Data in England",Policy & Internet,Vol.5,No.2,2013.

⑨田海平:《以公共伦理造就道德的人民——当前中国道德现实问题的征候及治理对策》,载《东南大学学报》2015年第2期。

⑩卢西亚诺·弗洛里迪(Lucinano Floridi)是牛津大学哲学与信息伦理学教授,欧洲信息哲学创始人。他在2014年参加腾讯互联网和社会研究院高峰论坛期间,谈到了文中提到的问题。这个问题也是信息伦理学的基本问题,即信息的开放共享与所有权的关系问题。

(11)参见邱仁宗等:《大数据技术的伦理问题》,载《科学与社会》2014年第1期。

(12)[]迈尔-舍恩伯格、库克耶:《与大数据同行——学习与教育的未来》,第132页。

(13)参见[]帕克:《全民监控——大数据时代的安全与隐私困境》,关立深译,金城出版社2015年版。

(14)Kord Davis,Doug Patterson,Ethics of Big Data,O'Reilly Media,2013.

(15)邱仁宗等:《大数据技术的伦理问题》,载《科学与社会》2014年第1期。

(16)吕耀怀:《信息技术背景下公共领域的隐私问题》,载《自然辩证法研究》2014年第1期。

(17)段伟文:《网络与大数据时代的伦理问题》,载《科学与社会》2014年第2期。

(18)参见[]迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,第27-97页。

(19)[]萨顿:《科学的历史研究》,刘兵等编译,上海交通大学出版社2007年版第22页。

(原载《马克思主义与现实》2016年第5期)