点击蓝字

关注我们



2026年3月5日,美国人工智能安全公司Anthropic正式发布研究报告《Labor market impacts of AI: A new measure and early evidence》(《人工智能对劳动力市场的影响:新测量框架与早期证据》)。报告是Anthropic经济指数系列研究(Anthropic Economic Index)的重要组成部分,旨在系统性地测量和追踪人工智能大语言模型对美国劳动力市场的实际冲击



从背景来看,当前关于人工智能经济影响的研究正在快速涌现,然而已有研究大多停留于理论能力的预测层面,即评估AI在技术上“能做什么”,而非“实际在做什么”。这一信息差导致政策制定者与劳动市场研究者难以准确把握AI造成经济位移的真实进程与速度。


本报告的最大创新点,在于提出了一个全新的测量指标——观测暴露度(Observed Exposure)。有别于既往研究仅依赖理论能力评分对职业暴露风险进行估计,该指标将理论可行性与真实使用数据相结合,重点关注在专业场景中被实际自动化执行的任务比例。


具体而言,观测暴露度的构建综合了三大数据来源:


· 美国职业信息网络数据库(O*NET),涵盖约800个职业的细分任务描述;

· Anthropic自身平台的Claude使用数据;

· Eloundou等人2023年发布的任务级别理论暴露度评分。


相较于传统方法,本报告的创新性体现在三个维度:


· 引入真实使用数据,从可能发生转向正在发生;

· 对自动化使用模式赋予更高权重,区别于仅具增强作用的辅助性使用;

· 将任务覆盖率按职业内各项任务的实际耗时比例加权汇总,使得职业层面的暴露评分更贴近实际工作结构。


报告同时运用美国现行人口调查(Current Population Survey, CPS)数据,将职业级别的暴露测量与个体劳动力市场结果,尤其是失业率和新就业率相匹配,以检验AI扩散是否已对就业产生可观测的统计效应。这一研究框架的设计初衷不仅在于当下的证据评估,更在于构建一套可定期更新、持续追踪的监测机制,以便在经济位移真正显现之前,为政策干预提供前瞻性参考依据。


01

研究背景:意义与目标

预测的局限性

人工智能对就业的影响,是当前全球经济政策讨论中最具争议的议题之一。从制造业自动化到数字平台经济,技术变革对劳动力结构的冲击从未停歇。然而,历史经验反复提示我们:技术冲击的实际轨迹,往往远比预言更为复杂。


报告援引了一系列经典案例以证明既有预测方法的局限。在离岸化研究领域,曾有研究预测约四分之一的美国就业岗位面临外包风险,但十年后的数据显示,这些职业中的大多数仍维持健康的就业增长态势。美国劳工统计局(Bureau of Labor Statistics, BLS)的职业增长预测,尽管方向上大体正确,却几乎没有超出对过去趋势进行线性外推的预测价值。


这些历史教训揭示出一个共同困境:经济扰动对劳动力市场的影响,往往难以从事后数据中被清晰辨识。当影响是渐进性的、分散在多个行业和时间段时,任何单一指标都可能被宏观经济周期、贸易政策变化等噪音所遮蔽。

研究目标:在效果显现前建立监测框架

本报告的核心目标并非一次性的效果评估,而是构建一套可持续迭代的分析框架。报告明确表示,这一方法将随新数据的产生定期更新,以形成关于AI如何改变就业格局的动态图景。


该框架的价值在于超前预警:通过追踪理论能力与实际使用之间的差距如何随时间收窄,研究者可以在经济位移成为既成事实之前识别最脆弱的职业群体,从而为政策制定者、企业管理者和劳动者个人提供前瞻性的参考依据。


报告同时坦诚其局限性:该框架不能捕捉AI重塑劳动力市场的所有渠道,例如AI赋能带来的新岗位创造、劳动生产率提升引发的需求扩张等正向效应,在当前分析中均未被纳入。


02

报告成果与分析

理论能力与实际使用之间的巨大落差

报告最引人注目的发现之一,是理论能力与实际使用之间存在的显著落差。从图中可以清晰看出,蓝色区域,理论可覆盖范围远大于红色区域即实际观测到的使用范围,在几乎所有职业类别中均存在大面积空白地带。



图1:理论能力与按职业类别观察到的暴露



表1:各职业类别理论能力与实际覆盖率对比


以计算机与数学类职业为例,理论上94%的任务均可被大语言模型覆盖,而实际上Claude仅涵盖了其中约33%的任务,实际覆盖率不足理论值的三分之一。办公与行政类职业的理论覆盖率达90%,而实际使用同样仅及其中很小一部分。这一落差的存在,深刻揭示了AI技术的实际渗透受制于多重现实障碍:模型本身的能力边界、法律合规约束、特定软件集成需求、人工审核流程等,均对AI在专业场景中的实际部署构成掣肘。值得关注的是,97%观测到的Claude使用案例落在理论可行性评分β≥0.5的任务中,说明用户的实际使用高度集中于理论上确实可行的任务范围内,两者具有较强的内在一致性。


这一发现具有深远的政策含义:若研究者仅以理论暴露度作为AI风险的代理变量,将严重高估AI在近期对特定职业造成的实际冲击。从治理视角看,这提示决策者应将监管重心从AI能做什么转向AI正在做什么,并建立动态更新的任务覆盖追踪机制。

最高暴露职业排名及其主导自动化任务

报告的最高暴露职业表呈现了在观测暴露度指标下排名前十的职业,以及驱动其高暴露评分的主导性自动化任务。


图2:最暴露的职业


计算机程序员以74.5%的观测暴露度高居榜首,这与Claude在编程任务上的广泛实际使用高度吻合。客户服务代表排名第二为70.1%,其主要任务已在企业API流量中被大量观测到自动化执行。数据录入员、医疗记录专员以及金融分析师紧随其后。


值得关注的是,上述职业的共同特征是:任务内容高度语言化或数据结构化,可操作边界清晰,且对物理感知、情感沟通或现场决策的依赖程度较低。这与大语言模型的能力边界高度匹配,即LLM擅长处理规则明确的文本与数据处理任务,而在需要具身交互、复杂判断或高度情境敏感性的任务中则表现受限。


相比之下,处于暴露度底端的职业,如厨师、摩托车修理工、救生员、调酒师、洗碗工等,其共同特点是强烈依赖物理操作、实时感知与人际互动,这些恰恰是当前AI技术最难触及的领域。约30%的劳动者因其职业任务在Claude流量数据中出现频次极低,观测暴露度为零。

暴露度与职业增长预测的负相关关系

报告将观测暴露度与美国劳工统计局(BLS)2025年发布的2024—2034年职业就业预测进行比较,二者呈现出统计上显著的负相关关系。


图3:BLS对2024年至2034年就业增长的预测与观察到的暴露


表2:BLS就业增长预测与AI暴露度的关系


回归结果显示,观测暴露度每上升10个百分点,BLS的就业增长预测便下降约0.6个百分点。这一结果在统计上具有显著性,但解释力有限,表明AI暴露度仅是影响职业增长预测的众多因素之一。


尤为值得注意的是,当仅使用Eloundou等人的理论暴露度评分时,与BLS预测之间并不存在类似的相关性。这一对比进一步验证了本报告方法论创新的有效性:将真实使用数据纳入暴露测量,能够捕捉到纯理论分析所忽略的信息。


从表中案例看,客户服务代表暴露度约0.65,BLS预测降幅约6%,是这一负相关关系最典型的代表;而软件开发者尽管暴露度较高,约0.3,却仍被预测保持强劲增长,这一反常现象提示我们:暴露度高并不必然意味着就业萎缩,AI对软件开发者的增强效应可能远大于替代效应。

高暴露职业劳动者的人口特征差异

报告利用2022年8月至10月(ChatGPT发布前三个月)的CPS数据,对处于观测暴露度最高四分之一与零暴露度群体的劳动者人口特征进行了系统性比较。两个群体之间的差异极为显著。


图4:高暴露与低暴露工人的差异


表3:高暴露与低暴露劳动者人口特征对比


高暴露群体的女性占比为54.4%,显著高于低暴露群体的38.8%,差距约15.5个百分点。高暴露群体持有本科学历的比例为37.1%,研究生学历比例为17.4%。高暴露群体的时薪均值约为32.69美元,较零暴露群体的22.23美元高出约47%。


这一人口学画像揭示出一个颇具反直觉意味的现象:AI替代风险最高的,并非传统意义上的低技能、低薪劳动者,而是受过高等教育、收入相对较高的职场女性群体。这一发现与所谓AI主要冲击低端重复性劳动的流行叙事形成鲜明对比,提示我们AI技术的颠覆性影响将以更为复杂的方式沿着技能与性别维度分布。


这一发现具有重要的社会公平含义。如果高度受教育、高收入的女性职业群体,如财务分析、法律助理、行政管理等成为AI冲击的主要承受者,传统的职业再培训政策可能难以有效应对,这些劳动者往往有较强的自我适应能力,但其转型路径与低技能劳动者截然不同,需要更具针对性的政策响应。

年轻劳动力入职率下滑:早期信号

报告在针对22至25岁年轻劳动者的分析中,发现了一个值得警惕的早期信号:在高暴露职业中,年轻劳动者的新就业入职率在2024年后出现了可见的相对下滑。


图5:观察到暴露和未接触AI的前四分位工人失业率趋势


具体而言,低暴露职业的月度新就业率维持在2%左右稳定水平;而高暴露职业的新就业率在2024年后降低了约0.5个百分点,后ChatGPT时期的合并估计为相对于2022年基期下降14%。值得注意的是,25岁以上劳动者并未呈现同样的趋势。


这一结果与Brynjolfsson等人2025年利用ADP薪酬数据发现22至25岁劳动者在高暴露职业中就业人数下降6%—16%的结论形成互证。报告分析认为,这一现象的主要驱动力是企业放缓了在高暴露职业上的新招聘而非解雇现有员工,且可能与年轻劳动者更多返回学校或转而进入低暴露职业有关。


这一发现的政策含义尤为深远:如果AI对劳动市场最初的可测量影响,集中体现为高暴露职业对年轻新入职者的吸纳能力下降,那么受冲击最重的将是那些在AI时代来临时恰好处于职业起点的一代人,他们不仅面临就业通道收窄,更面临早期职业积累的机会被剥夺。这对教育体系、职业培训制度以及劳动力市场准入政策均提出了全新挑战。


03

总结


Anthropic发布的这份研究报告,以其严谨的方法论设计和审慎的结论表达,在人工智能劳动力影响研究领域树立了一个重要的范本。报告最核心的贡献,在于将AI能做什么与AI正在做什么这两个问题明确区分,并通过将真实使用数据引入暴露度测量,填补了理论预测与实证监测之间的方法论空白。


报告传递出三个层次递进的信息:


第一,AI技术的实际部署远未达到其理论能力上限,当前绝大多数职业的实际自动化覆盖率仅为理论值的一小部分;


第二,尽管如此,观测暴露度与独立来源的职业增长预测之间已呈现出统计上显著的负相关关系,说明劳动力市场对AI扩散的前瞻性预期已在结构层面有所体现


第三,在就业结果层面,迄今尚未发现高暴露职业劳动者整体失业率上升的系统性证据,但年轻劳动者进入高暴露职业的新就业率出现了初步可测的相对下滑,这一早期信号需要持续关注。


本报告提示各方关注以下几点核心判断:


其一,AI对就业的冲击并不均匀,受冲击最大的是高学历、高收入的特定职业群体,尤其是女性从业者较多的事务性和分析性岗位,这要求劳动力政策超越传统的低技能保护框架,建立面向不同职业生命周期阶段的精准支持机制;


其二,就业冲击在时间上具有渐进性,且早期可能主要表现为招募放缓而非裁员加速,因此就业监测体系需要从存量指标失业率转向包含增量指标,即新就业率、招聘岗位数的综合体系;


其三,年轻劳动者和应届毕业生群体是目前可识别的最脆弱群体,针对他们的职业路径规划和技能培训干预应被优先纳入政策议程。


从研究前景看,报告所建立的分析框架具备持续迭代的内在设计,随着AI使用数据不断积累、职业暴露评分随模型能力更新而修订,以及劳动力调查数据的时间维度延伸,未来版本的研究将有望在更精细的粒度上识别AI对就业的真实影响路径。


总体而言,这份报告所呈现的,是一幅关于AI就业冲击的早期地图:地图上,有些区域已经清晰可辨,有些仍笼罩在不确定的迷雾之中。但正如报告结语所言,在经济位移尚未完全显现时建立这套监测框架,其本身即具有不可替代的价值——唯有提前布局,方能在变局真正到来时,将信号从噪音中清晰辨识。



内容中包含的图片若涉及版权问题,请及时与我们联系删除