我给“开放爪”智能体装上了实体身体
作者: aeks | 发布时间: 2026-05-21 18:02 | 更新时间: 2026-05-21 18:02
学科分类: 人工智能 控制科学与工程 机械工程 计算机科学与技术
文章以作者亲身体验为主线,讲述了如何借助AI编程技术快速上手机器人控制。他购入开源机械臂LeRobot 101,该系统包含一个由人操控的主控臂和一个带摄像头的跟随臂,通过遥操作训练AI模型学习视觉反馈与动作映射。初期他遭遇硬件连接与校准困难,甚至差点烧毁电机;但在OpenClaw框架和AI编程助手Codex帮助下,仅用几小时就实现了‘看到红色小球即闭合夹爪’的简易功能——AI自动配置通信、校准关节、编写Python脚本调用多库完成识别与抓取。尽管存在AI幻觉导致的bug,效果已令人振奋。文章进一步指出,‘代码即策略’并非新概念,2022年已有研究提出,其核心是让AI生成可执行代码作为机器人行为策略,兼顾传统工程方法的可靠性与多模态模型的泛化能力。为评估该范式,伯克利机器人专家Ken Goldberg联合英伟达、CMU、斯坦福推出新基准CaP-X,结果显示谷歌Gemini在机器人编程任务中表现最优,可能得益于其深度多模态与物理世界理解训练。配套工具CaP-Gym支持仿真与真机控制,CaP-Agent0框架更显著提升AI编码模型的操作性能,甚至超越专为运动控制训练的模型。目前,Goldberg团队正与英伟达合作,推动该方法兼容更多机器人软件生态。英伟达工程师Spencer Huang(黄仁勋之子)强调:让‘几乎任何人’都能用自然语言或动作示范操控机器人,才是机器人真正融入社会的关键突破。