知識業務タスクを評価するベンチマーク「GDPval」では、「GPT‑5.2 Thinking」が同社のモデルとしては初めて人間の専門家レベルに

知識業務タスクを評価するベンチマーク「GDPval」では、「GPT‑5.2 Thinking」が同社のモデルとしては初めて人間の専門家レベルに