OpenAI发布GPT-5.2,应对紧急挑战

作者: aeks | 发布时间: 2025-12-25 08:01 | 更新时间: 2025-12-25 08:01

OpenAI应用部门CEO菲吉·西莫(Fidji Simo)在周四的记者会上表示:“我们宣布这一‘红色代码警报’(code red),是为了向公司明确传达我们希望将资源集中在特定领域,这是确定优先事项的一种方式。我们已增加了总体上专注于ChatGPT的资源。”她否认OpenAI因“红色代码警报”而提前了GPT-5.2的发布时间,称公司数月来一直在筹备该模型的发布,但补充说,围绕ChatGPT的额外资源“很有帮助”。

尽管2022年ChatGPT推出时,OpenAI的模型和产品被认为是同类最佳,但现在情况已非如此。这家初创公司如今面临众多强劲挑战者,其中谷歌的威胁或许最大——谷歌近期推出的Gemini 3模型在科技行业反响良好。过去一年,谷歌Gemini应用的增长速度令人瞩目,目前月活跃用户已超过6.5亿,而OpenAI的周活跃用户为8亿。这种压力迫使OpenAI搁置了一些最具雄心的项目,包括在ChatGPT中引入广告的计划,并重新聚焦于改进核心技术和产品。

与该公司近期发布的模型类似,GPT-5.2以系列模型的形式推出:Instant(即时型)响应更快,更适合信息查找;Thinking(思考型)擅长编码、数学和规划;Pro(专业型)则是OpenAI最强大的模型层级,能在难题上提供更高的准确性。

OpenAI称GPT-5.2是其迄今为止最适合日常专业使用的模型。GPT-5.2 Thinking在GDPval(OpenAI的一项基准测试,用于比较AI模型与人类专业人员在44个现实世界职业中的表现)上取得了迄今为止的最高分。该公司表示,该模型在超过70%的任务中击败了人类专业人员,且完成速度快11倍。

OpenAI的训练后负责人马克斯·施瓦泽(Max Schwarzer)表示,新版本还将大幅减少幻觉(即生成虚假信息的情况)。公司称,在衡量事实性问题答案的基准测试中,GPT-5.2 Thinking的幻觉比GPT-5.1减少了38%。

该公司正将GPT-5.2同时推向ChatGPT用户和OpenAI API产品的开发者,并表示这一系列新模型“在日常和高级使用场景中均带来显著提升”。

尽管GPT-5.2在纸面上的表现令人印象深刻,但基准测试分数只能说明模型发布的一部分情况。今年早些时候OpenAI发布GPT-5时,用户对该模型冷淡的响应表示不满,而这种特质很难仅通过基准测试来衡量。最终,该公司在GPT-5发布几天后推出了更新,使其“更温暖”。

OpenAI模型发布面临的一个关键矛盾是:如何让ChatGPT更易于聊天以提高使用率,同时又不让其过于谄媚——即AI模型过度迎合的倾向。过去一年,OpenAI还应对了与ChatGPT使用相关的一系列心理健康挑战。10月,该公司发布的一份报告显示,每周有超过100万人与ChatGPT谈论自杀话题。同月,负责公司内部心理健康工作的一位研究负责人宣布计划离开OpenAI。

但在谷歌和Meta等公司的竞争压力下,OpenAI有强烈的动机扩大ChatGPT的用户群。据《纽约时报》报道,10月,OpenAI的ChatGPT负责人尼克·特利(Nick Turley)向公司发送备忘录,称其正面临“有史以来最大的竞争压力”。为应对这些压力,特利据称设定了在2026年前将日活跃用户增加5%的目标。

OpenAI表示,通过GPT-5.2,公司继续加强了对涉及自残、心理健康困扰或对模型产生情感依赖等敏感提示的响应。该公司还称,已开始在部分国家推出此前宣布的年龄预测模型,该系统将允许公司对其估计未满18岁的用户自动应用内容保护措施。

西莫表示,公司计划在2026年第一季度推出“成人模式”,而此前奥特曼曾表示,该模式将允许18岁以上用户与ChatGPT进行“色情”对话。

标签: OpenAI 专业模型 幻觉减少 竞争压力