OpenAI发布GPT-5.2，应对紧急挑战

作者: aeks | 发布时间: 2025-12-25 08:01 | 更新时间: 2025-12-25 08:01

OpenAI应用部门CEO菲吉·西莫（Fidji Simo）在周四的记者会上表示：“我们宣布这一‘红色代码警报’（code red），是为了向公司明确传达我们希望将资源集中在特定领域，这是确定优先事项的一种方式。我们已增加了总体上专注于ChatGPT的资源。”她否认OpenAI因“红色代码警报”而提前了GPT-5.2的发布时间，称公司数月来一直在筹备该模型的发布，但补充说，围绕ChatGPT的额外资源“很有帮助”。

尽管2022年ChatGPT推出时，OpenAI的模型和产品被认为是同类最佳，但现在情况已非如此。这家初创公司如今面临众多强劲挑战者，其中谷歌的威胁或许最大——谷歌近期推出的Gemini 3模型在科技行业反响良好。过去一年，谷歌Gemini应用的增长速度令人瞩目，目前月活跃用户已超过6.5亿，而OpenAI的周活跃用户为8亿。这种压力迫使OpenAI搁置了一些最具雄心的项目，包括在ChatGPT中引入广告的计划，并重新聚焦于改进核心技术和产品。

与该公司近期发布的模型类似，GPT-5.2以系列模型的形式推出：Instant（即时型）响应更快，更适合信息查找；Thinking（思考型）擅长编码、数学和规划；Pro（专业型）则是OpenAI最强大的模型层级，能在难题上提供更高的准确性。

OpenAI称GPT-5.2是其迄今为止最适合日常专业使用的模型。GPT-5.2 Thinking在GDPval（OpenAI的一项基准测试，用于比较AI模型与人类专业人员在44个现实世界职业中的表现）上取得了迄今为止的最高分。该公司表示，该模型在超过70%的任务中击败了人类专业人员，且完成速度快11倍。

OpenAI的训练后负责人马克斯·施瓦泽（Max Schwarzer）表示，新版本还将大幅减少幻觉（即生成虚假信息的情况）。公司称，在衡量事实性问题答案的基准测试中，GPT-5.2 Thinking的幻觉比GPT-5.1减少了38%。

该公司正将GPT-5.2同时推向ChatGPT用户和OpenAI API产品的开发者，并表示这一系列新模型“在日常和高级使用场景中均带来显著提升”。

尽管GPT-5.2在纸面上的表现令人印象深刻，但基准测试分数只能说明模型发布的一部分情况。今年早些时候OpenAI发布GPT-5时，用户对该模型冷淡的响应表示不满，而这种特质很难仅通过基准测试来衡量。最终，该公司在GPT-5发布几天后推出了更新，使其“更温暖”。

OpenAI模型发布面临的一个关键矛盾是：如何让ChatGPT更易于聊天以提高使用率，同时又不让其过于谄媚——即AI模型过度迎合的倾向。过去一年，OpenAI还应对了与ChatGPT使用相关的一系列心理健康挑战。10月，该公司发布的一份报告显示，每周有超过100万人与ChatGPT谈论自杀话题。同月，负责公司内部心理健康工作的一位研究负责人宣布计划离开OpenAI。

但在谷歌和Meta等公司的竞争压力下，OpenAI有强烈的动机扩大ChatGPT的用户群。据《纽约时报》报道，10月，OpenAI的ChatGPT负责人尼克·特利（Nick Turley）向公司发送备忘录，称其正面临“有史以来最大的竞争压力”。为应对这些压力，特利据称设定了在2026年前将日活跃用户增加5%的目标。

OpenAI表示，通过GPT-5.2，公司继续加强了对涉及自残、心理健康困扰或对模型产生情感依赖等敏感提示的响应。该公司还称，已开始在部分国家推出此前宣布的年龄预测模型，该系统将允许公司对其估计未满18岁的用户自动应用内容保护措施。

西莫表示，公司计划在2026年第一季度推出“成人模式”，而此前奥特曼曾表示，该模式将允许18岁以上用户与ChatGPT进行“色情”对话。

标签: OpenAI 专业模型幻觉减少竞争压力