2023年2月28日,北京信息科技发展中心主办、阿里巴巴人工智能治理与可持续发展研究中心(AAIG)协办的《这个AI不太冷》第一期ChatGPT专题研讨会在北京举办。本文根据北大国发院助理教授、数字金融研究中心研究员胡佳胤的发言整理。
我今天要讲这个题目以ChatGPT为切入点,实际上更多地还是看普遍意义上的算法和人工智能给整体经济带来的影响,挂一漏万,请大家指正。我的视角是经济学和金融学,主要分析以ChatGPT为代表的人工智能对数字经济的影响,重点有如下三个方面:
·替代还是互补?ChatGPT对未来工作性质和劳动力市场的改变
·纠偏还是带偏?在算法与人的交互中,人发挥的作用
·壁垒还是机遇?对数据价值和数字经济竞争格局的影响
第一点是如何看待ChatGPT及其代表的人工智能、算法、机器学习等各种数字技术对工作的影响,尤其是说这对于人力是替代还是互补。因为ChatGPT刚问世时,很多讨论都认为大量的人可能从此失业,或者未来的工作性质和内容有变,这都是对劳动力市场的改变。
第二点如何看待人工智能和算法对决策的作用,是有助于纠正人在决策中的认知偏误,还是放大偏差。这不只是关系到数字技术在经济生产上的运用,还对社交网络的发展、价值观的形成和整个经济社会的组织形式都有较大影响。
第三点如何看待人工智能的时代到底是制造了数字经济市场竞争中的壁垒,还是创造了新的机遇。一方面是人工智能和算法本身的重要性,另一方面,用于算法训练的数据集也具有相当的价值。数据和算法既有可能成为市场竞争的进入壁垒,也有可能给弯道超车和跨界竞争提供机遇。
替代还是互补?ChatGPT对劳动力市场的改变
先展开讲第一点,ChatGPT对未来工作内容性质和劳动力市场的影响。
ChatGPT出来之后,非常多的新闻报道和自媒体都讲到它对写作和内容创意行业的颠覆。ChatGPT对写作、修改润色、信息归纳、创意和编程能力的替代作用惊人。现在很短的时间内,用户就可以让ChatGPT根据指令生成一些讲话稿、新闻稿和对资料的整理等等。这也意味着这些行业里,从业者所积累的相应技能的贬值速度大大提高。
我们一度也在想,研究者写论文的工作是不是也要被替代掉?因为我们发现ChatGPT可以迅速生成文献综述和研究计划,而且写得非常流畅。
当然,ChatGPT会存在信息准确度不高甚至编造事实、创造虚假信息的问题,包括像对学术文献的捏造。可能是因为ChatGPT本身没有联网,接入的信息比较滞后,而且还没有学术期刊数据的获取权限,所以它整理输出的很多论文都是自己编出来的,就带来了信息真真假假的情况。
但我们想象一下,假设这些数据库都对ChatGPT开放,而且不允许它编造内容,那么未来研究者做的大量工作是不是都可以交给ChatGPT?再想一想我们每个人工作的性质和内容,是不是大部分都可能会被替代掉?
在经济学的研究里,人工智能对劳动力市场的影响被总结为三个效应。
第一个是替代效应。比如说以往人们工作里大量的重复性、机械性的体力劳动被机器人所替代,现在则体现为一些重复性、模板化的脑力活动(例如文字资料的整理写作和一些编程工作)被人工智能所替代掉。
第二个是互补效应。人工智能与人互补的作用往往体现在需要人为介入或干预的工作上。比如说ChatGPT生成的一些内容可能需要审核,或者需要人进一步编辑、承诺、担责等,这时候人工智能就变成一个所谓的助理职能,跟人承担的其他工作角色形成互补。人在其中发挥着不可替代的功能。
第三个是创造效应。人工智能在摧毁一部分的工作的同时又提供一些新工作。这与数字经济的蓬勃发展和新职业新岗位的诞生密切相关。
值得强调的一点是,ChatGPT等数字技术带来的是异质化影响,对不同的劳动力群体影响不一样,会有结构上的改变和不同人感受的分化。以前的机器可能是替代一些重复性的体力劳动或者相对低端的工作,但ChatGPT等人工智能的发展实际上是对白领工作的很大冲击。它其实不一定影响低教育背景的人群工作;像服务业(包括快递外卖和理发等等)还是需要大量的人去线下工作。
基于美国数据的研究表明,过去几十年,大量的中端工作被技术进步替代掉了(当然还有全球化和国际分工的影响)。但相对高端的工作和相对低端的工作一直存在,反倒是中间的与脑力劳动相关的一些白领工作会被替代掉(或外包)。
MIT的Daron Acemoglu教授和合作者有一系列研究都是关于人工智能对劳动力市场的影响。他们把每一项工作的具体工作内容拆分开,看一看有哪些是比较简单重复的工作,哪一些是需要人与人之间面对面交流或者说更注重情感体验的工作。他们把这些工作内容分为很多个维度,然后把每一项工作可能被人工智能替代掉的概率做了排名。
左边的图是按职业类型排名,右边是按行业大类排名。我们其实看到的是很多管理类的职位被AI替代的概率最大,其后还有一些专业技能类的岗位,还有办公行政类的岗位。
具体到行业领域来说,像金融业,现在大量运用金融科技进行数字化转型,很多可能都不用雇佣柜员、放贷员和客户经理,而是更多地雇佣编程人员,或者运用算法来进行人力上的精简。相对最不容易被人工智能替代的反倒是类似零售行业和仓储物流行业等传统线下工作的岗位和行业。
以前我们可能担心机器人的大规模应用让一些低教育背景或者低技能的人失业,现在人工智能的发展则可能是让白领工作更难找,所以这就会带来一个对宏观经济的结构化影响。也许大学生以后能找工作的范围变得可能更加局限。当然,也有可能数字经济中又有更多新的职业被创造出来,比如说自媒体职业和创业。但确实未来的就业市场的发展变得更加复杂,我们传统教育方式的回报率可能下降,学校能给年轻人带来的知识和技能附加值很可能变得更低。
我们自己也用中国数据做了一些分析,通过智联招聘上职位空缺的发布情况来看理论上的人工智能替代率和企业实际招工情况之间的关联。这些结果总结在北大国发院和智联招聘联合发布的《2022雇佣关系趋势报告:数字时代的多元雇佣关系》中。具体而言,北大国发院的李力行教授及合作者把上面讲的各个工作的内容和性质特征对应到中国的职位中来,计算了一个人工智能的替代率(被自动化、智能化替代的概率可以参见论文:https://www.nsd.pku.edu.cn/cbw/jjxywkw/cejxwg/501438.htm)。然后我们计算出2018年至2022年间各职位大类职位招聘发布数量的变动率,将这一职位数量变动率为纵轴,被人工智能替代概率为横轴作散点图,每个点表示一个职位大类。我们预期被人工智能替代概率高的职业在2018-2022年间发布的职位数量会逐渐减少,所以预计散点拟合出的趋势线应该是向下倾斜的。
但是实证结果表明,该趋势线较为平缓,甚至是略微向上倾斜的。这表明2018-2022年职位数量变动情况与被人工智能替代概率关联不大。近年职位数量变动可能更多地反映了短期经济形势的影响,在短期,人工智能替代就业的趋势还没有体现出来。
我们的发现其实跟美国的情况也类似。Acemoglu教授和合作者在分析2010-2018年间美国的在线招聘广告数据时,在微观公司层面确实发现了AI技术的引进和AI的冲击对这些公司招聘的影响。例如,受AI影响更大的公司降低了非AI相关的招聘,同时也会雇佣更多的具有算法或者相关背景的人员,而且招聘广告中要求的技能更新迭代速度更快。然而,在加总的职位或行业整体层面,他们也并未看到AI算法对劳动力市场的显著影响。微观层面的变化从宏观上来看并不显著。
中美两边的职位招聘数据都没有在宏观层面看到AI代替人工的明显趋势,这个挺有意思。因为我们通常都认为数字技术和人工智能的发展是代表未来的发展方向,然而短期内我们很难从整体层面看到影响。一方面这个技术它本身也是在发展的初期阶段,另一方面高科技公司可能也只是整个经济体的一部分。(“However, while AI technologies appear to be changing task and skill composition at exposed establishments, any aggregate effects of AI, if present, are not yet detectable—plausibly because AI technologies are still in their infancy and have spread to only a limited part of the US economy.”)
再者,每个企业自己要真的去采用新技术(technology adoption)也是需要时间的。市场的优胜劣汰也需要一个过程。包括像我们之前研究的远程办公也是如此。通讯、互联网和数字技术的进步其实已经让远程办公成为一个可行的选择。也有研究指出了远程办公可以通过降低通勤成本来提高工作效率,并为员工提供更多平衡家庭和事业的空间,增强大家工作的幸福感。但事实上,在疫情爆发之前,我们很少会看到有企业提供远程办公的选项。疫情催化了部分企业远程办公的持续转型。
值得指出的是,这些研究使用的都是ChatGPT出现前的招聘数据,无法捕捉最新的动态发展。ChatGPT是否催化了人工智能对劳动力的替代?这一点值得我们持续关注。
纠偏还是带偏?算法与人的交互中人发挥的作用
第二点要展开讲的是以ChatGPT为代表的人工智能在与人交互时扮演的角色。人做决策时,可能或多或少都会带有一点认知的偏差,甚至是自觉或不自觉的歧视。
我以自己从事的金融科技研究来分析人工智能的运用效果。人工智能在金融领域的运用之一就是智能投顾(robo-advising),通过算法来帮助投资者做决策。人们自己做投资决策时,往往会有一些情感和认知上的因素在起作用。有一些就是行为金融学领域已经被反复研究和验证过的偏误,比如说过度自信。研究里往往发现中年男性的过度自信特征尤其明显,所以他们经常会采取一些激进的股市投资策略,比如重仓个股,这往往代表了投资者对自己选股能力的过度自信。但金融学理论认为你应该采取一个多样化的资产配置。再比如频繁地买进卖出,这往往代表了投资者对自己“择时”能力的过度自信,因为投资者总觉得自己可以在低位买进,然后高位卖出,但事实往往反过来。金融学文献已经对各种非理性投资行为有丰富的记载。
如果可以通过智能投顾的方式,让投资者把钱放在算法控制的智能投顾平台里面,那就相当于是让人工智能算法来做决策,实际上是可以拉平不同投资者之间的投资表现。这已经有相当多的文献验证了这一点。当然,股市投资整体能不能赚到钱,金融市场是不是有效,这就不仅仅是算法问题。
人工智能和算法在金融领域的第二个运用就是借贷中的金融科技。国发院黄益平老师有一系列关于大科技信贷的研究分析,包括蚂蚁集团提供的310贷款等等。我们有一项新的研究是看一家传统小贷公司的金融科技转型。我们发现这家公司在采用金融科技算法模型之前,对本地和外地借款人有一个差异化的对待。当然我们也不能直接说这是非理性的人为歧视,因为可能放贷员觉得他们不太了解外地人,信息不对称更严重,所以给定同样的抵押品,他们给外地人放贷的总金额偏小,未必非理性。
但我们发现这家公司引入算法决策之后,外地人能获得的贷款金额上升,放贷时的本地人外地人差异减小,而且最终外地人的实际违约率也没有上升,说明之前的人工决策确实是有一定的认知偏差。这个不仅对公司的利润有影响,而且也关系到普惠金融的发展。
更有意思的是,这家公司在引入算法之前其实已经引入了一个金融科技的大数据信用评分,理论上应该是可以缓解信息不对称问题。但是我们并没有发现这个大数据评分对本地借款人和外地借款人获得的贷款金额差异有影响。一个可能的解释是说这个大数据信用评分只是对人的决策起到一个辅助作用,并没有像算法模型那样替代人的决策。也就是说放贷员对外地人的认知偏差或者所谓歧视(taste discrimination)依然存在,只有当算法替代了人工决策时,影响才会出现。
智能投顾和金融科技借贷的例子表明人工智能和算法可能带来一个优势,即缓解人在决策中的认知偏差和歧视。
但同时算法也有可能带来新的歧视和偏差。学术界在这个方向上也发现了相关的证据支持。比如有研究表明,采用机器学习算法会加剧美国少数族裔借款人在金融借贷中面临的不平等。很多算法可能自身有一些根据统计性特征来进行的“算法歧视”和“大数据杀熟”,还有一些强化学习带来的“数字上瘾”的影响,包括通过给用户推送各自偏好的内容,让人们处在一个所谓的信息茧房之中,产生一个回声壁效应。
大数据杀熟这一点已经有很多人在讲。当然这里有一个算法的动态调整优化问题,但如果算法在拥有大量消费者行为数据的同时又不披露自身的决策机制,消费者就损失了相当的知情权和公平交易的机会。
另外就是之前讲到的信息茧房和回声壁效应,比如说你只要点开了一个内容,大数据就会源源不断的给你推送相关的东西。从短视频到新闻资讯再到社交媒体,算法都在极力捕捉你的偏好,以此留住用户和增强用户的活跃度。但同时它可能带来信息乃至思想的割裂,个体认知上的差异会因此不断放大。
还有一点就是所谓的数字成瘾,算法其实是会把人性的一些弱点(例如低自控力等等)放大。这个可能是防沉迷系统想要解决的一个问题。但也许算法只是一个表层原因,真正的成因可能还是要回到经济社会中的一些问题中来。
值得注意的是,算法的效果跟用于训练的数据集也密切相关。比如人工智能帮助修复照片,而用来训练的图片大部分都是白人照片,那么给它一个黑人的照片,有可能修复出来就偏白,这在国外就是非常敏感的问题。
另一方面,在用户数据隐私保护加强的时代,假设一部分消费者不愿意共享数据,或者不愿意共享某些类型的数据,则能用来训练算法的范围可能也会变得更小,甚至可能有一定的系统性偏差。这样训练出来的算法能代表多大的一个群体值得思考,尤其是在一些有价值观和社会影响的层面。
壁垒还是机遇?对数据价值和数字经济竞争格局的影响
最后展开讲一讲人工智能对于数据价值和市场竞争格局的影响。
数据是否已经成为一个市场进入的壁垒?数据对人工智能算法的训练至关重要。现在各个大科技平台的用户流量以及用户在平台上的交易和活动所形成的数据,都成为了这些大科技公司的重要资产。在这种情况下,学习效应和网络效应会进一步强化。因为一旦有了活跃的用户,平台就可以积累更多的数据,有了数据算法又能被训练得更精准,更能捕捉用户的喜好,或者孵化一些创新的产品,则这个用户就更愿意使用这个平台。这样一来市场份额可能会更多地向头部公司集中。
但另一方面,从动态演进的视角来看,新平台基于公开数据的算法能力也许可以在一定意义上超越老平台基于用户数据和业务数据的一个既定优势。这就是我们想讲的一个可竞争性(contestability)问题。这是美国经济学家鲍默尔最先提出来的,更多地侧重市场进入退出的自由性而非市场当前的竞争格局。因为自然垄断、网络效应等数字经济本身的特点本身就让多家企业分割市场变得不是那么有效率。
静态来看,也许市场上只有一两家企业,但动态来看,随时可能有新企业发力。那么这个市场的力量还是会让平台企业回归到一个比较良性的竞争态势。政府关注的重点则应该是反不正当竞争,以及降低市场进入或退出的门槛,为中小创新企业的发展营造良好的市场环境。
另外还有两点思路值得一提。
一是提高政府公共数据的供给。
如果公共数据比较有限,企业发展就只能更多地倚仗自身用户的数据。给定数据对AI算法训练的重要性,大企业、大平台相对于中小企业和初创企业就有着天然的数据优势。用户交互在平台上留存下来的数据与数字平台的业务各方面密切相关,是平台企业的核心资产。虽然政府可以推动数据交易,但仍然会面临实际执行中激励兼容的问题。
但实际上数据是有很多种的,一种就是政府等公共部门开放的数据。从国际比较的视野来看,我们国家政府公共数据的供给比较有限。仅以经济金融学术研究为例,在美国,每笔贷款的数据尤其是房贷的数据,进行匿名化处理后能系统性地提供给研究者。很多研究者利用这个数据来剖析次贷危机的成因和美国家庭金融发展的趋势。但国内研究分析可用的一些基础数据库似乎还相对有限。相对而言,国家统计局做了很好的工作。
数据可能会形成一种壁垒,而政府公共数据的开放和供给则有助于促进市场竞争和繁荣。所以未来如果能有序逐步开放政府公共数据,不仅是对学术研究有利,还可以增强数据流通的普惠性,降低孵化各种人工智能创新的门槛。
二是普惠性AI平台的出现和普及。
比如说一家餐厅或美容店,能不能有一套自己的AI系统,记住每个到店消费的客户的喜好,并对服务加以优化。外卖平台是不是能记住用户喜欢吃什么样的菜式,然后根据天气和季节变化以及用户的个性化需求生成一套菜单或是买菜清单,用户一键就可以下单,不用操心每天要吃什么等等。这类普惠性的AI平台可能类似于二维码支付,当推广到很多消费者和中小商家中间时,可以衍生出来非常多的新业态。这也给数字经济提供了一个兼具普惠性和想象力的发展方向。