这家初创公司想在美国掀起一场“深度求索”热潮

作者: aeks | 发布时间: 2025-10-20 12:09 | 更新时间: 2025-10-20 12:09

专注于去中心化人工智能的初创公司Prime Intellect目前正通过一种新型分布式强化学习技术对其前沿大语言模型INTELLECT-3进行微调训练。该公司首席执行官文森特·魏瑟（Vincent Weisser）表示，这种方式能让不同地点的多种硬件协同构建具有竞争力的开源AI模型，且无需依赖科技巨头。魏瑟指出，当前人工智能领域呈现两极分化——一部分依赖美国的封闭模型，另一部分则采用中国的开源产品。而Prime Intellect开发的技术正推动AI民主化，让更多人能够自主构建和修改先进的人工智能系统。如今，改进AI模型已不再仅仅是增加训练数据和计算资源的问题。前沿模型在预训练完成后，会借助强化学习进一步提升性能——若想让模型擅长数学、解答法律问题或玩数独，可让其在能衡量成败的环境中不断练习来自我提升。魏瑟称，这些强化学习环境如今已成为真正提升模型能力的瓶颈。为此，Prime Intellect打造了一个框架，任何人都能基于特定任务创建定制化的强化学习环境。该公司正结合内部团队与社区开发的优质环境，对INTELLECT-3进行调优。该公司研究员威尔·布朗（Will Brown）创建了一个用于解决Wordle谜题的环境，作者曾见证小型模型借此解题（其方法比作者更有条理）。若AI研究员想改进模型，只需启动多块GPU，让模型反复练习，同时通过强化学习算法调整权重，即可将模型训练成Wordle高手。尽管强化学习如今至关重要，但主要由大型AI公司秘密进行，且通常需要大量专业知识，多数企业和开发者难以企及。魏瑟认为，让初创公司能自主开展强化学习，有望催生各类任务专用的智能体等有价值的新型软件产品。一些专家对此表示认同。特斯拉前AI团队负责人安德烈·卡帕西（Andrej Karpathy）在Prime Intellect公布其强化学习环境后不久，便称其为‘一项伟大的努力和创意’，并鼓励开源研究者利用不同环境适配新任务，以新方式提升先进模型的技能。魏瑟还提到：‘在开源前沿模型方面，美国几乎已无计可施，这正是我们试图改变的现状之一。’

标签: AI民主化 INTELLECT-3 Prime Intellect 分布式强化学习开源前沿模型