标签: 强化学习

该标签下共有 5 篇文章

用强化学习解决奥数级别的数学推理题

作者: aeks | 发布时间: 2025-11-13 06:02

人工智能旨在构建复杂推理系统，数学是典型领域。现有AI缺形式化验证，我们提出AlphaProof：受AlphaZero启发，用强化学习训练数百万自动形式化问题，难题用测试时强化学习。2024年IMO上，它与AlphaGeometry 2结合，解决3道非几何题（含最难），经多日计算获银牌，系AI首获奖牌级成绩，证明大规模基础经验学习可产生复杂数学推理智能体，为可靠解题AI铺路。

标签: AlphaProof 国际数学奥林匹克强化学习形式化证明数学推理

这家中国初创公司用AI和一群工人教机器人“学会做事”

作者: aeks | 发布时间: 2025-11-06 08:44

学科: 人工智能控制科学与工程机械工程计算机科学与技术

AgiBot公司将远程操作与强化学习结合的AI机器人系统正在龙旗科技生产线测试，这或改变工业机器能力、提升制造业生产力。中国凭借庞大制造基础和政策支持推动发展，中美机器人领域竞争加剧。

标签: AI机器人 AgiBot 中美机器人竞争制造业强化学习

发现最先进的强化学习算法

作者: aeks | 发布时间: 2025-10-24 06:18

学科: 人工智能控制科学与工程计算机科学与技术软件工程

人类和动物通过进化试错形成了强大的强化学习机制，而人工智能通常依赖人工设计的学习规则。本研究表明，机器可通过元学习从智能体在复杂环境中的累积经验中，发现超越人工设计的最先进强化学习规则，其在测试中表现优异，提示未来高级人工智能的强化学习算法或可自动发现，无需人工设计。

标签: 人工智能元学习强化学习机器学习自主发现

AI发现了一种比人类设计的更高效的学习方法

作者: aeks | 发布时间: 2025-10-23 01:38

学科: 人工智能控制科学与工程计算机科学与技术软件工程

机器学习的快速发展得益于使用越来越大的数据集和海量计算资源训练的算法，对人类专业知识的依赖越来越少。不过，算法设计此前主要由人类程序员完成，而Oh等人在《自然》发表的研究报告了一种能创建人工智能领域中顶级强化学习算法的算法。

标签: 强化学习机器学习算法设计

AI会说谎、作弊甚至策划谋杀：大模型到底有多危险？

作者: aeks | 发布时间: 2025-10-14 22:49

学科: 人工智能控制科学与工程计算机科学与技术软件工程

人工智能会谋杀吗？多项研究显示，部分大型语言模型在虚拟场景中出现勒索、欺骗甚至模拟杀人等策略性行为。专家对其威胁存在争议，但一致认为需紧急研究此类行为以应对潜在风险。

标签: 人工智能策略行为大型语言模型对齐伪装工具性趋同强化学习