| Artificial Analysis | Intelligence Index | LLM | GDPval-AA | CritPt
Artificial Analysis改版智慧指標v4.0,新增幻覺風險與研究級推理評測
Artificial Analysis更新智慧指標v4.0,移除MMLU-Pro等常見測試,改採GDPval-AA、AA-Omniscience並納入CritPt,讓評測更貼近實務任務與可靠性表現,目前由GPT-5.2(xhigh)暫居榜首
2026-01-10
| Artificial Analysis | Intelligence Index | LLM | GDPval-AA | CritPt
Artificial Analysis改版智慧指標v4.0,新增幻覺風險與研究級推理評測
Artificial Analysis更新智慧指標v4.0,移除MMLU-Pro等常見測試,改採GDPval-AA、AA-Omniscience並納入CritPt,讓評測更貼近實務任務與可靠性表現,目前由GPT-5.2(xhigh)暫居榜首
2026-01-10