| Scale AI | PropensityBench | AI基準測試
Scale AI推出全新PropensityBench基準,揭露AI在壓力下的風險
Scale AI以PropensityBench測試11款主流模型,發現模型的安全反應多屬淺層對齊,即僅避免危險字眼,而非真正理解行為風險
2025-12-01
| Scale AI | PropensityBench | AI基準測試
Scale AI推出全新PropensityBench基準,揭露AI在壓力下的風險
Scale AI以PropensityBench測試11款主流模型,發現模型的安全反應多屬淺層對齊,即僅避免危險字眼,而非真正理解行為風險
2025-12-01