外部专家评估结果

小黄:在外部专家的评估中,GPT-5 Pro的表现如何?

DOORM:在对1000多个具有经济价值的现实世界推理问题的评估中,67.8%的答案来自GPT-5 Pro,显示出其较高的相关性和实用性[Float-Menu id=”1″]。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注