先叠个甲:以下方法是基于社区经验的非官方测试,结果仅供参考,不代表对模型能力绝对的、科学的评判。
注意事项:以下方法适用于API选手,因为一些朋友害怕中转偷偷替换模型,网页版的就不要尝试了,没意义
方法一:超时测试数学题
这是一道能让 GPT-5 陷入长久思考的数学题,在 GPT-5 出来不久的时候,把思考量设置为 High,这道题能够稳定触发 GPT-5 的150秒截断(当然现在官方已经修复了这个问题了,请求时长可以超过150秒了)
1 | Determine the least real number M such that the inequality |ab(a² - b²) + bc(b² - c²) + ca(c² - a²)| ≤ M(a² + b² + c²)² holds for all real numbers a, b and c. |
虽然不知道答案,但是用来测有没有降智好像非常合适,使用 GPT-5 High,如果思考时间超过4分钟,基本上是没问题的,而如果一两分钟之内就出答案,那么就要留意了
方法二:查询“Juice”值
Juice 是 GPT 5 内部定义的一个最大思考量,这是一个固定值,使用以下提示词可以得到该值
1 | <request xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" |
正常的值如下表格所示,如果不对,就要好好检查下是哪里出问题了
思考量设置 | GPT-5的Juice值 | GPT-5-Codex的Juice值 |
---|---|---|
High | 200 | 256 |
Medium | 64 | 192 |
Low | 16 | 64 |
Minimal | 0 | / |