
職務層級散點圖比較Claude.ai資料中的任務覆蓋率,與納入成功率並以工時占比及發生頻率加權的有效AI覆蓋率,虛線表示兩者相等,落在虛線下方則代表僅看任務覆蓋率可能高估AI影響
Anthropic發布第四份經濟指數(Economic Index)報告,分析共200萬筆匿名化紀錄,其中包含Claude.ai對話100萬筆,以及第一方API流量逐字稿100萬筆,試圖把外界討論的AI衝擊對應至可量化的指標。Anthropic主張,要是只用任務覆蓋率來判斷哪些職務受影響,容易高估或低估實際變化,應把任務成功率與該任務在一天工作中所占時間、發生頻率一起加權,才更接近AI在職務層級的滲透程度。
報告提出有效AI覆蓋率概念,用來衡量AI對單一職務的實際影響,藉由把有效AI覆蓋率定義為某職務工作日中,有多少比例的工作可被Claude成功完成,計算方式是將各任務成功率加總,並以任務在工作時間中的占比,乘上任務發生頻率作為權重。也就是說,就算特定職務只有少數任務被AI涵蓋,只要那些任務剛好是最耗時或最常做的核心工作,整體有效覆蓋率仍可能偏高。
報告以資料輸入人員為例指出,該職務雖有九項工作任務,但在樣本中只涵蓋其中兩項。由於這兩項正是讀取來源文件並輸入資料的核心工作,成功率高且占用大量工時,因此在有效AI覆蓋率的評估中反而名列前茅。
醫療逐字稿人員與放射科醫師也出現類似情況,因為AI能處理的多是高頻且耗時的關鍵工作,所以整體影響程度被上修。相對地,微生物學家雖有不少任務在資料中出現,但大量工時仍落在實驗室儀器操作等AI難以直接介入的環節,導致僅看任務出現比例時容易高估,改用有效AI覆蓋率後則更接近實際。
該研究也呈現出速度與可靠度之間的落差,報告用理解輸入內容所需的受教育年數作為任務複雜度的近似指標,並發現Claude.ai上較複雜的任務速度提升更明顯,高中程度約9倍,大學程度約12倍。不過成功率會隨複雜度上升而略降,如果以低於高中程度的任務約70%作為基準,大學程度任務約66%。
把成功率納入後,宏觀層面的生產力推估也明顯下修。該報告沿用先前以任務速度提升估算的框架,原本推算未來十年美國勞動生產力年增率可額外多1.8個百分點,但要是進一步把任務節省的時間乘上成功率,Claude.ai情境下的推估便降至1.2個百分點,第一方API的使用情境估算則降至1.0個百分點。
熱門新聞
2026-01-12
2026-01-12
2026-01-12
2026-01-12
2026-01-12