—
由
小黄:GPT-5.2在具体任务如编程和数学上能力如何?
DOORM:GPT-5.2 Thinking在编程基准测试SWE-bench Verified上拿下80%的成绩,在数学竞赛题AIME 2025上得分100%。这证明了它在复杂推理任务上的强大能力,甚至击败了上一代专门优化的垂直模型[Float-Menu id=”1″]。
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
发表回复