亚马逊推出新AI模型,还能让客户自己动手搭建
作者: aeks | 发布时间: 2025-12-03 10:01 | 更新时间: 2025-12-03 10:01
学科分类: 电子信息 网络空间安全 计算机科学与技术 软件工程
电商巨头亚马逊在拉斯维加斯举办的re:Invent大会上,发布了第二代Nova人工智能模型。这些模型虽不如OpenAI、谷歌等竞争对手的产品知名,但亚马逊计划将其高度定制化,有望吸引云服务用户。此次发布的模型包括两款改进的大型语言模型Nova Lite与Nova Pro、新的实时语音模型Nova Sonic,以及更具实验性的Nova Omni——它能结合图像、音频、视频和文本进行模拟推理。目前,这些新模型已向少数客户开放使用。
更重要的是,考虑到云业务的重要性,亚马逊同步推出工具Nova Forge。客户可将自己的训练数据添加到未完成的Nova 2 Lite和Pro模型中,从而创建专业的前沿模型。尽管像谷歌Gemini、OpenAI GPT等现有AI模型已支持微调,但Nova Forge的独特之处在于,客户能在模型训练的多个阶段(包括通常只有大型AI实验室才能触及的“定制预训练”阶段)添加数据。
亚马逊AI业务负责人罗希特·普拉萨德在发布前告诉《连线》杂志:“每个企业都在寻找能成为自身领域专家的前沿模型。”他表示,开发Nova Forge背后的技术是为了赋能内部团队(如开发Alexa和AI代理的团队)构建定制模型,“这本质上是一种新的开放式训练范式”。
Reddit已率先测试该工具,利用Nova Forge开发了用于识别平台违规内容的定制模型。Reddit首席技术官克里斯·斯洛指出,常规微调无法满足需求,因为多数模型为避免冒犯性内容会拒绝分析部分材料;而定制预训练结合常规微调,打造出了真正懂Reddit的“专家模型”。他还提到,该模型用途广泛,下一步很可能用于内容审核自动化。此外,Booking.com、索尼及生物科技公司Nimbus Therapeutics等也在测试Nova Forge。
企业对AI工具的需求正超越通用模型能力,贝恩咨询11月调查显示,约四分之三的美国企业将AI列为重点,但普遍面临缺乏构建定制模型所需专业知识和资源的问题。当前AI模型分闭源(仅通过API或应用访问)和开源(可下载并在自有硬件运行)两类,开源模型(以阿里巴巴、深度求索等中国公司产品为主)因成本低、易修改受青睐,但其训练数据不公开,限制了调优。
Nova Forge提供了新方案(虽绑定亚马逊云),普拉萨德称,用它构建前沿模型成本远低于从零开发(从零需数亿至数十亿美元),但未透露具体数字。亚马逊在AI竞赛中虽属“黑马”(较晚开发尖端语言模型),但正悄然积累先进AI能力,还将生成式AI融入购物平台(如电商聊天助手Rufus)。与其他科技巨头一样,亚马逊正投资数十亿美元建设AI基础设施,押注AI需求将持续高速增长。
在云业务上,亚马逊与谷歌、微软竞争;OpenAI也在快速建设自身基础设施,未来或成云服务参与者,并投资80亿美元于竞争对手Anthropic(由ChatGPT团队前成员创立)。亚马逊还试图挑战英伟达的硬件主导地位,Anthropic的最新模型便基于亚马逊定制的Trainium芯片训练。
亚马逊称,Nova 2 Pro在多项基准测试中达到或超越OpenAI的GPT-5、GPT-5.1,谷歌的Gemini Pro 2.5、Gemini 3.0 Pro及Anthropic的Sonnet 4.5,尤其擅长复杂指令执行、计算机工具使用等智能代理任务;Nova 2 Lite则与Claude 4.5 Haiku、GPT-5 Mini、Gemini Flash 2.5水平相当。Nova 2 Omni则展现了亚马逊的AI研究实力,作为全模态推理模型,它能接收图像、音频、视频和文本输入并生成输出,普拉萨德称尚无其他AI公司发布此类全模态模型。斯洛认为,Nova的定制化特性潜力巨大,“在众多场景下,它会远胜于现成模型”。