双子座AI现在能帮你手机叫车或点外卖了

作者: aeks | 发布时间: 2026-03-08 20:01 | 更新时间: 2026-03-08 20:01

学科分类: 信息与通信工程 网络空间安全 计算机科学与技术 软件工程

十年前,苹果Siri和谷歌助手曾承诺能替用户完成日常任务(如叫Uber、点星巴克咖啡),但实际体验生硬,功能陆续下线。如今,依托大语言模型和自然语言理解能力,谷歌与三星在Galaxy Unpacked发布会上重新推出这项能力:Gemini语音助手可直接操控第三方App完成具体操作,例如‘帮我叫辆Uber去机场’或‘用Grubhub为朋友聚餐下单披萨’。它通过虚拟窗口打开App,在后台执行操作,用户可随时点击通知查看进度;遇到模糊信息(如不确定去哪个机场)会主动提问,但不会擅自做决定(如选车型、确认订单),最终仍需用户手动确认。Gemini并非靠预设规则‘死记硬背’App界面,而是像人一样观察屏幕、推理步骤——即使App改版,它也能适应。除直接操作界面外,Gemini还可通过开源协议(MCP)或开发者提供的结构化接口(App Functions)更高效地完成任务。当前功能处于早期预览阶段,仅限美国和韩国,首发搭载于3月11日上市的三星Galaxy S26,并将通过系统更新支持Google Pixel 10系列。谷歌强调隐私保护:不收集数据用于广告,敏感App暂未接入,用户可随时删除Gemini访问过的数据。未来,该能力有望扩展至智能眼镜、AI挂饰甚至车载系统,但关键操作(如支付确认)仍需用户在可信设备上完成二次验证,防止误用或盗用。

标签: 大语言模型应用 安卓任务自动化 屏幕感知交互 智能助手自动化 移动智能新范式