这家初创公司想在美国掀起一场“深度求索”热潮

作者: aeks | 发布时间: 2025-10-20 12:09 | 更新时间: 2025-10-20 12:09

学科分类: 人工智能 信息与通信工程 计算机科学与技术 软件工程

这家初创公司想在美国掀起一场“深度求索”热潮
这家初创公司想在美国掀起一场“深度求索”热潮

专注于去中心化人工智能的初创公司Prime Intellect目前正通过一种新型分布式强化学习技术对其前沿大语言模型INTELLECT-3进行微调训练。该公司首席执行官文森特·魏瑟(Vincent Weisser)表示,这种方式能让不同地点的多种硬件协同构建具有竞争力的开源AI模型,且无需依赖科技巨头。魏瑟指出,当前人工智能领域呈现两极分化——一部分依赖美国的封闭模型,另一部分则采用中国的开源产品。而Prime Intellect开发的技术正推动AI民主化,让更多人能够自主构建和修改先进的人工智能系统。如今,改进AI模型已不再仅仅是增加训练数据和计算资源的问题。前沿模型在预训练完成后,会借助强化学习进一步提升性能——若想让模型擅长数学、解答法律问题或玩数独,可让其在能衡量成败的环境中不断练习来自我提升。魏瑟称,这些强化学习环境如今已成为真正提升模型能力的瓶颈。为此,Prime Intellect打造了一个框架,任何人都能基于特定任务创建定制化的强化学习环境。该公司正结合内部团队与社区开发的优质环境,对INTELLECT-3进行调优。该公司研究员威尔·布朗(Will Brown)创建了一个用于解决Wordle谜题的环境,作者曾见证小型模型借此解题(其方法比作者更有条理)。若AI研究员想改进模型,只需启动多块GPU,让模型反复练习,同时通过强化学习算法调整权重,即可将模型训练成Wordle高手。尽管强化学习如今至关重要,但主要由大型AI公司秘密进行,且通常需要大量专业知识,多数企业和开发者难以企及。魏瑟认为,让初创公司能自主开展强化学习,有望催生各类任务专用的智能体等有价值的新型软件产品。一些专家对此表示认同。特斯拉前AI团队负责人安德烈·卡帕西(Andrej Karpathy)在Prime Intellect公布其强化学习环境后不久,便称其为‘一项伟大的努力和创意’,并鼓励开源研究者利用不同环境适配新任务,以新方式提升先进模型的技能。魏瑟还提到:‘在开源前沿模型方面,美国几乎已无计可施,这正是我们试图改变的现状之一。’

标签: AI民主化 INTELLECT-3 Prime Intellect 分布式强化学习 开源前沿模型