独家：Adobe新AI技术可改变配音中的情绪

作者: aeks | 发布时间: 2025-10-29 21:39 | 更新时间: 2025-10-29 21:39

Adobe将其称为“修正型AI”，这是该公司今日晚些时候在MAX Sneaks展示会上演示的众多功能之一，该展示会是更大型年度MAX会议的一部分（Adobe支付了我参加MAX会议的部分差旅费）。Sneaks是Adobe展示其正在研发的未来技术和原型的平台，其中许多功能最终会在数月内整合到Adobe全套创意套件中。

今年MAX大会期间，Adobe发布了Firefly的生成式语音功能，该功能不仅允许用户使用多种预设语音，还能添加情感标签来改变语调。而这项修正型AI功能则将该功能融入了更实用的工作流程——无需使用完全由AI生成的语音，用户可以修饰现有的语音表演。

Adobe的李·布里梅洛还向我展示了AI如何提取单个音轨的不同部分来创建多个音轨。名为“纯净录制”（Project Clean Take）的Sneaks原型目前最多支持五个音轨，但它能分离人声、环境噪音、音效等。AI模型分离音轨的精确度令人惊讶。在一个示例中，Adobe展示了有人在吊桥前讲话，吊桥钟声完全盖过人声，运行AI模型后，钟声消失了；更棒的是，用户还能通过单独调整这些分离音轨的音量将钟声重新调回。

在另一个示例中，Adobe演示了这对在公共场所拍摄的创作者有何用处，尤其是当背景中有受版权保护的音乐时。众所周知，在YouTube等平台的自动系统中，未经授权使用音乐很容易导致版权警告。演示中，Adobe的AI模型能分离音乐，用Adobe Stock中的相似音轨替换，并添加效果以赋予其原音轨的混响和氛围，这一切只需点击几下。

这些功能利用AI解决视频编辑和创作者的日常问题，帮助修复受损音频或省去重新录制人声表演的时间和麻烦。Adobe在Sneaks展示会上还将展示新的生成式AI功能。对于音效设计师，该公司向我展示了其AI模型如何自动分析视频并添加音效，据称这些音效均由AI生成且可安全商用。

Adobe的奥里奥尔·涅托加载了一段包含几个场景和旁白但没有音效的短视频。AI模型分析视频并将其分解为场景，为每个场景添加情感标签和描述，然后生成音效。例如，AI模型识别到闹钟场景，便自动创建了闹钟音效；识别到主角（此处是一只章鱼）开车的场景，便添加了关门音效。

不过这些功能并非完美无缺。闹钟声不够真实，在两个角色拥抱的场景中，AI模型添加了不自然的衣服摩擦声，效果不佳。但Adobe无需手动编辑，而是使用类似ChatGPT的对话界面描述修改需求。比如在汽车场景中没有车内环境音，用户无需手动选择场景，只需通过对话界面让AI模型添加汽车音效，AI便能成功找到场景、生成音效并完美放置。

这些实验性功能目前尚未推出，但通常会逐步整合到Adobe套件中。例如，Photoshop中的“和谐融合”功能（能自动将素材以准确的色彩和光线融入场景）去年在Sneaks展示，现已纳入Photoshop。预计这些新功能将于2026年某个时候推出。

Adobe宣布这些功能的几个月前，视频游戏配音演员结束了近一年的罢工，以争取AI相关保护——当游戏开发商想通过AI重现配音演员的声音或形象时，公司需获得同意并提供披露协议。配音演员长期以来一直在为AI对行业的影响做准备，而Adobe的新功能（即便并非从头生成旁白）也再次标志着AI正推动创意产业发生转变。

标签: AI音频视频功能 Adobe MAX Sneaks 人工智能音效创意产业