GPT-5.2在编程和数学上的表现

小黄:GPT-5.2在具体任务如编程和数学上能力如何?

DOORM:GPT-5.2 Thinking在编程基准测试SWE-bench Verified上拿下80%的成绩,在数学竞赛题AIME 2025上得分100%。这证明了它在复杂推理任务上的强大能力,甚至击败了上一代专门优化的垂直模型[Float-Menu id=”1″]。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注