所有 Windows 11 电脑都将迎来这些强大的 AI 助手功能

作者: aeks | 发布时间: 2025-10-20 14:11 | 更新时间: 2025-10-20 14:11

学科分类: 人工智能 信息与通信工程 计算机科学与技术 软件工程

随着系统更新,微软同步启动广告宣传活动,向用户展示这些新功能。选择此时机并非偶然:Windows 10支持已于10月14日结束,一波用户即将升级到Windows 11,微软希望借此让尽可能多的人用上Copilot高级功能,并让他们觉得这些功能值得使用。

核心在于语音交互

“嘿,Copilot”——这是语音模式下AI助手的唤醒词,现已面向所有Windows 11电脑推出。不管用户是否习惯,微软希望大家开始与电脑“对话”。公司在所有Windows 11设备上引入新的Copilot功能,支持在应用和整个操作系统中与Copilot进行直接语音交互。多年来,智能手机已具备不同程度的语音交互能力,微软自家的Copilot+系列笔记本也早有此功能。

“近四十年来,电脑的交互方式主要是鼠标和键盘,”微软消费者首席营销官优素福·迈赫迪说,“但如果能更进一步,直接与电脑对话呢?在我们看来,语音将成为电脑的第三种输入方式。”

推动语音直接交互有数据支撑。迈赫迪提到微软对用户语音交互行为的观察,例如听写、记笔记、语音输入和转录等场景。他还表示,由于使用便捷,用户用语音操作Copilot应用的频率是打字的两倍。“人们现在是‘通过’电脑说话,而非‘对着’或‘与’电脑说话,”他说,“但我们认为这种情况将会发生巨大改变。”

随着语音Copilot登陆所有Windows 11电脑,微软希望用户更多使用其AI功能。迈赫迪强调,这并非要完全取代鼠标和键盘,而是让语音成为“补充”。

不过,迈赫迪在回顾时似乎漏掉了“触控”这一输入方式。微软曾斥巨资试图通过Windows 8将电脑打造成触控优先的操作系统,并力推Windows平板(及Windows手机),但最终除Surface Pro等特定设备外,该尝试以失败告终。或许语音交互会是另一番景象。

Copilot Vision与交互操作

向AI提供的提示和上下文越多,它能完成的任务就越多。语音输入的上下文传递不够直观,而Copilot Vision正好解决这一问题——它能“看到”屏幕内容并据此提供帮助。该功能自6月起已在Copilot+系列电脑上线,如今将面向所有Windows 11电脑开放,即使没有神经网络处理单元(NPU)的设备也能使用。谷歌最近也在Chrome浏览器中添加了类似功能。

Copilot Vision最突出的应用场景之一是软件教程。若在复杂软件中找不到某个操作或菜单,它能快速指引方向。它是一个悬浮工具栏,可跟随用户切换到任意应用或Windows界面,依据屏幕内容(无论是整个桌面还是单个窗口)提供帮助。

这意味着用户无需过多提示,结合语音控制,体验就像有位懂行的朋友在旁边指导。微软将其称为“要点提示”,只需对Copilot说“教我怎么做”即可触发,适用于照片编辑、查看日历、列购物清单等场景。在Word、Excel、PowerPoint等应用中,Copilot Vision甚至能“看到”屏幕外的内容,比如演示文稿中未显示的幻灯片或Word文档中未完全展示的页面。

迈赫迪还提到游戏Copilot,它将Copilot Vision引入游戏领域,适用于电脑或新款ROG Xbox Ally等设备。演示中,助手能为玩家在开放世界冒险游戏中提示下一步任务方向。

当Copilot Vision与Copilot Actions结合时,趣味性便显现出来——这是微软对AI代理的探索。Copilot Actions能根据自然语言指令,在本地应用或操作系统中替用户执行操作。例如,无需Vision指引在Photoshop中找隐藏设置,Actions可直接帮你开启;还能批量编辑文件夹中的照片,或从大型PDF中提取信息。

微软还展示了Copilot Actions的未来规划,凸显“为AI重构Windows 11”的愿景。Windows预览体验成员现已可用的“连接器”功能,支持在Copilot应用内直接在本地电脑执行操作,如打开OneDrive文件、邮件,甚至创建PowerPoint演示文稿。微软称,谷歌日历、Gmail等第三方应用也将接入Copilot。

例如,用户可让Copilot查找牙医预约详情,或通过描述找到特定文件。只要允许Copilot访问相关应用,它不仅能定位应用和文件,还能对其执行操作。这与曾因安全问题受争议的Recall功能(Copilot+电脑专属)有部分重叠,但微软表示两者将共存。而Click to Do等Copilot+专属功能,仍需设备配备更强大的本地NPU以实现更快AI处理,因此会保持专属。

Copilot Actions自2024年底起已集成于微软365 Copilot企业工具,此次是首次向普通Windows用户广泛推送。微软表示该功能“将在未来几个月内上线”,届时用户除语音外,也可用文字指令触发Copilot Actions。

这种在搜索中直接操作应用的理念,与苹果在macOS Tahoe中通过Spotlight Actions和快捷指令实现的功能类似,但微软的野心显然更大。目前,Copilot仍需通过语音唤醒或点击任务栏搜索栏中的应用图标调出,但不难想象它未来可能演变为Windows的主要交互界面。

这些新功能真能让用户更多使用Copilot吗?尚难断言。由于多种原因,Windows用户的行为习惯改变缓慢,从Windows 10升级到11本身已颇具挑战。

标签: Copilot Actions Copilot Vision Windows 11 微软Copilot 语音交互