标签: 强化学习

该标签下共有 13 篇文章

用“试错学习”来控制量子纠错

作者: aeks | 发布时间: 2026-07-09 18:03

量子计算机极易受环境干扰出错。传统纠错需反复中断计算来重新校准，无法满足未来长期运行算法的需求。本研究提出新方法：让纠错过程同时承担双重任务——既纠正量子态错误，又将检测到的错误信号作为‘学习线索’，训练人工智能实时调整控制参数，边算边学、永不中断。

标签: 参数漂移实时校准强化学习逻辑错误率量子纠错

这个机器人实习生，办公能力太强，让人害怕

作者: aeks | 发布时间: 2026-06-29 20:02

学科: 控制科学与工程机械工程计算机科学与技术软件工程

瑞士初创公司Flexion Robotics开发出一种新方法：先在电脑模拟中教会机器人开门、爬楼梯、搬箱子等基础技能，再用一个‘主AI’自动组合这些技能完成复杂任务。普通人只需下达自然语言指令，机器人就能自主执行，无需人工遥控。

标签: 人形机器人任务规划仿真训练强化学习机器人基础模型

开发AlphaGo的人认为，人工智能走错了方向

作者: aeks | 发布时间: 2026-04-28 03:01

学科: 控制科学与工程智能科学与技术计算机科学与技术

本文介绍AI科学家戴夫·西尔弗的全新探索：他创立公司Ineffable Intelligence，放弃依赖人类文本的大语言模型路线，转而专注“自主学习”的强化学习路径，目标是打造能自我发现科学、技术与社会新范式的超级智能，为人类长远福祉服务。

标签: 人工智能安全大语言模型强化学习自主学习超级智能

维基百科驱动的AI模型盘点出值得关注的100项新技术

作者: aeks | 发布时间: 2026-04-24 03:02

学科: 人工智能管理科学与工程统计学计算机科学与技术

澳大利亚研究团队利用AI分析维基百科数据，发布2026年‘势头100强’新兴技术榜单：强化学习居首，区块链、3D打印、软体机器人等上榜。该榜单不依赖专家意见，而是通过大数据客观识别真正快速兴起的技术趋势。

标签: 3D打印区块链强化学习新兴技术预测组学

用自主机器人击败顶尖乒乓球高手

作者: aeks | 发布时间: 2026-04-23 03:04

学科: 控制科学与工程机械工程电子信息计算机科学与技术

本文介绍了一款名为Ace的自主机器人系统，它是全球首个能在真实比赛中与顶尖人类乒乓球运动员一较高下的AI系统。Ace通过高速视觉感知、无模型强化学习控制及先进硬件，成功应对了乒乓球对反应速度、精准度和对抗性的严苛要求。

标签: 乒乓球机器人事件相机实时人机交互强化学习物理人工智能

多巴胺“失宠”了：大脑科学为何重新审视这种“快乐物质”

作者: aeks | 发布时间: 2026-04-13 18:04

学科: 临床医学心理学生物医学工程神经科学

多巴胺常被称作‘快乐物质’，但新研究发现它远不止传递奖赏信号——还参与注意力、记忆、威胁识别甚至行为预测。本文介绍神经科学界正就多巴胺的核心作用展开激烈辩论：经典‘奖赏预测误差’理论是否已过时？这对理解与治疗多动症（ADHD）、成瘾等疾病有深远影响。

标签: 多巴胺奖赏预测误差强化学习神经可塑性

大脑中的“多巴胺”如何影响我们的社交分工

作者: aeks | 发布时间: 2026-04-12 12:03

学科: 心理学神经科学行为科学

本研究发现，小鼠群体在觅食任务中会自发形成分工角色，且这种分工存在显著的性别差异：雄性小鼠易发展出‘劳动者’与‘搭便车者’的竞争关系，雌性则倾向采取统一合作策略。这一过程由脑内腹侧被盖区（VTA）多巴胺活动调控，并可通过改变多巴胺水平或调整群体组成来动态重塑。

标签: 多巴胺强化学习性别差异社会分工行为可塑性

物理实体让活性物质能“感知”到超出直接触觉的信息

作者: aeks | 发布时间: 2026-04-04 15:01

学科: 力学控制科学与工程物理学生物医学工程

活体微生物能感知水流等环境变化并做出反应，但人工微机器人一直难以做到。本研究发现：无需专门传感器，仅靠自身物理运动特性（如形状、受热后运动方式），微机器人就能‘感知’并对抗看不见的水流干扰。通过强化学习训练，它们学会利用运动中的细微线索自动调整路径，成功在强水流中抵达目标。这为开发无需复杂传感器的微型医疗机器人等自主系统提供了新思路。

标签: 具身智能强化学习形态计算微游泳者自热泳

用强化学习解决奥数级别的数学推理题

作者: aeks | 发布时间: 2025-11-13 06:02

学科: 数学计算机科学与技术

人工智能旨在构建复杂推理系统，数学是典型领域。现有AI缺形式化验证，我们提出AlphaProof：受AlphaZero启发，用强化学习训练数百万自动形式化问题，难题用测试时强化学习。2024年IMO上，它与AlphaGeometry 2结合，解决3道非几何题（含最难），经多日计算获银牌，系AI首获奖牌级成绩，证明大规模基础经验学习可产生复杂数学推理智能体，为可靠解题AI铺路。

标签: AlphaProof 国际数学奥林匹克强化学习形式化证明数学推理

这家中国初创公司用AI和一群工人教机器人“学会做事”

作者: aeks | 发布时间: 2025-11-06 08:44

学科: 人工智能控制科学与工程机械工程计算机科学与技术

AgiBot公司将远程操作与强化学习结合的AI机器人系统正在龙旗科技生产线测试，这或改变工业机器能力、提升制造业生产力。中国凭借庞大制造基础和政策支持推动发展，中美机器人领域竞争加剧。

标签: AI机器人 AgiBot 中美机器人竞争制造业强化学习